TIESINĖ REGRESIJA
description
Transcript of TIESINĖ REGRESIJA
![Page 1: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/1.jpg)
TIESINĖ REGRESIJA
![Page 2: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/2.jpg)
Pavyzdžiai
• Koks parduodamų ledų kiekis priklausomai nuo oro temperatūros?
• Kaip sistolinis kraujo spaudimas priklauso nuo KMI?
• Kaip išlaidos priklauso nuo pajamų?• Ar gimstamumas priklauso nuo šeimos pajamų?• Išmatavome IQ pirmame kurse. Ar galima
prognozuoti koks bus studento diplomo pažymių vidurkis?
• Kokį vidutinį VS studento baigiamojo darbo balą galima prognozuoti, jei visas studijų balų vidurkis 8,7?
![Page 3: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/3.jpg)
Tiesinė regresija ir koreliacija
• Tas pats koreliacijos koeficientas gali nusakyti skirtingą priklausomybę (stipri, silpna, teigiama, neigiama)
• Regresinė analizė leidžia prognozuoti vieną kintamąjį kito atžvilgiu
• Koreliacija simetriška, regresiniai modeliai kintamųjų atžvilgiu asimetriški.
![Page 4: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/4.jpg)
Skirtingos koreliacijos pavyzdys
• Koreliacija tarp išlaidų reklamai ir pajamų yra 0,99 – stiprus teigiamas ryšys.
• Ar naudinga firmai padidinti išlaidas reklamai?
• Atrodytu, kad taip!
• Tačiau tokį rezultatą gali duoti tiek įdėtas 1 Lt ir gautas kelių Lt pelnas, tiek kelių cnt. pelnas.
![Page 5: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/5.jpg)
Kintamieji
• Kintamasis, kurio reikšmes norima prognozuoti, vadinamas priklausomu kintamuoju (dependent variable).
• Kintamasis, pagal kurio reikšmes norima prognozuoti priklausomo kintamojo reikšmes, vadinamas nepriklausomu kintamuoju (independent variable).
![Page 6: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/6.jpg)
Regresijosmodeliai
Paprasta Daugialypė(multiple)
Tiesinė(linear)
Netiesinė(non-linear)
Tiesinė(linear)
Netiesinė(non-linear)
Vienas nepriklausomas kintamasis
Du ir daugiau nepriklausomų kintamųjų
![Page 7: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/7.jpg)
Paprastos tiesinės regresijos modelis
y=a+bx+ey ir x kintamieji
a ir b konstantos (a- laisvasis narys (angl. intercept), b-tiesės krypties koeficientas (angl. slope))
e atsitiktinė paklaida
![Page 8: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/8.jpg)
Regresijos grafinis vaizdas
![Page 9: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/9.jpg)
Tiesinės regresijos žingsniai
1. Priklausomo ir nepriklausomo kintamojo nustatymas.
2. Jų ryšys (tiesinis – koreliacija).Daugialypėje regresijoje multikolinearumo įvertinimas tarp
nepriklausomų kintamųjų.
3. Regresijos modelio vertinimas:• Determinacijos koeficientas.• ANOVA• Regresijos koeficientai, jų stat. reikšmingumas.• Paklaidų (residuals) analizė (išskirtys, paklaidų
grafikai).4. Galutinės lygties užrašymas, jos interpretacija.
![Page 10: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/10.jpg)
Pavyzdys excel –Automobilio taisymo kainos
priklausomybė nuo ridos
Priklausomas kintamasis – remonto kainaNepriklausomas kintamasis – ridaDuomenys:
![Page 11: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/11.jpg)
KORELIACIJA
![Page 12: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/12.jpg)
Lygtis ir hipotezė
y=a+bx
Tikrinama H0: b=0
HA: b≠0
![Page 13: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/13.jpg)
Excel – “Data analysis” → “Regression”
![Page 14: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/14.jpg)
Analizės išklotinė
![Page 15: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/15.jpg)
Grafiškai pagal duomenis(Automobilio taisymo kainos priklausomybė nuo ridos)
![Page 16: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/16.jpg)
Išklotinės rezultatai – ką vertinti?
![Page 17: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/17.jpg)
Determinacijos koeficientas,ANOVA,regresijos koeficientai
![Page 18: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/18.jpg)
Paklaidų analizė
• Išskirtys (iš grafiko arba standartizuotų paklaidų)
• Vidurkiai lygūs nuliui
• Paklaidų skirstiniai normalūs
• Dispersija tolygi (homoskedatiška)
• Paklaidos atsitiktinės
(aiškinimas youtube: http://www.youtube.com/watch?v=vM13uarpcuQ)
![Page 19: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/19.jpg)
Paklaidų vidurkiai lygūs nuliui
![Page 20: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/20.jpg)
Paklaidų skirstiniai normalūs
![Page 21: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/21.jpg)
Paklaidų dispersija tolygi (homoskedatiška)
![Page 22: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/22.jpg)
Galutinės lygties užrašymas(Automobilio taisymo kainos priklausomybė nuo ridos)
Remonto kaina=-197,3+0,01*rida(km)
Jei nepriklausomas kintamasis (rida) padidėja vienu vienetu (1 km), priklausomas kintamasis (remonto kaina) padidės dydžiu, lygiu b įverčiui (0,01 USD).
![Page 23: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/23.jpg)
Grafiškai(Automobilio taisymo kainos priklausomybė nuo ridos)
![Page 24: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/24.jpg)
Tiesinė daugialypė regresija
![Page 25: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/25.jpg)
Pavyzdžiai
• Ar poegzamininis dirglumas priklauso nuo gauto pažymio, nuo egzamino trukmės ir nuo ko labiau?
• Kaip antikvarinės keramikos kaina priklauso nuo jos senumo ir aukciono dalyvių skaičiaus?
• Ar diplomo pažymių vidurkis ir komunikabilumas gali padėti prognozuoti būsimą atlyginimą?
![Page 26: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/26.jpg)
Tiesinė daugialypė regresija
y=a+b1x1+b2x2+b3x3+ …+ bjxj+e
Tikrinama H0: b=0
HA: bent vienas b≠0
![Page 27: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/27.jpg)
Tiesinė daugialypė regresija
Prieš pradedant įvertinama:• Koreliacija• Multikolinearumas (nepriklausomų kintamųjų
priklausomybė vienas nuo kito)– Ryšys paprastai žinomas iš praktikos– Ryšio stiprumui nustatyti skaičiuojame koreliacijos
koeficientą• Stat. paketuose skaičiuojame VIF ir tolerance.
Kintamasis “perdaug multikolinearus”:– Jeigu VIF>4– Jei tolerance artėja prie nulio
![Page 28: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/28.jpg)
Tiesinė daugialypė regresija
![Page 29: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/29.jpg)
Tiesinė daugialypė regresija
![Page 30: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/30.jpg)
Tiesinė daugialypė regresija
kaina=85,71+0,01*rida(km)-92,74*išsilavinimas
![Page 31: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/31.jpg)
Tiesinės regresijos (paprastos ir daugialypės) atlikimo reziumė
1. Priklausomo ir nepriklausomo kintamojo nustatymas.
2. Jų ryšys (tiesinis – koreliacija).Daugialypėje regresijoje multikolinearumo įvertinimas tarp
nepriklausomų kintamųjų.
3. Regresijos modelio vertinimas:• Determinacijos koeficientas.• ANOVA• Regresijos koeficientai, jų stat. reikšmingumas.• Paklaidų (residuals) analizė (išskirtys, paklaidų
grafikai).4. Galutinės lygties užrašymas, jos interpretacija.
![Page 32: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/32.jpg)
Tiesinės regresijos prielaidos
– Stebėjimai:• Tiesinis ryšys• Normalūs skirstiniai (bet nebūtinai)• Dipersijos panašios
– Paklaidos• e normaliai pasiskirstę atsitiktiniai dydžiai;• visų e vidurkiai lygūs nuliui;• visų e dispersijos tolygios (homoskedatiškos);• visi e nepriklausomi.
![Page 33: TIESINĖ REGRESIJA](https://reader035.fdocuments.net/reader035/viewer/2022081418/568143f7550346895db084e7/html5/thumbnails/33.jpg)
Pagrindinės priežastys, dėl kurių tiesinė regresija gali netikti
1. Kintamųjų priklausomybė nėra tiesinė
2. Stebėjimai heteroskedatiški
3. Paklaidų skirstiniai nėra normalieji
4. Paklaidos nėra atsitiktinės
5. Duomenyse yra išskirčių