Korelacija i Regresija

40
STATISTIKA U PSIHOLOGIJI 2 LINEARNA KORELACIJA LINEARNA REGRESIONA ANALIZA Oliver Tošković Univerzitet u Beogradu Filozofski fakultet

description

Korelacija i Regresija

Transcript of Korelacija i Regresija

  • STATISTIKA U PSIHOLOGIJI 2

    LINEARNA KORELACIJA LINEARNA REGRESIONA ANALIZAOliver TokoviUniverzitet u BeograduFilozofski fakultet

  • Parametri i statisticiParametar - statistika mera numerike karakteristike populacije

    Statistik - statistika mera numerike karakteristike uzorka

  • ta je korelacija?Korelacioni nacrt: sve varijable numerikeKorelacija:Korelacioni bivarijantni nacrtPovezanost dve varijableNema nezavisnih i zavisnih varijabliZasnovana na slinosti promenePromena u vremenuPromena izmeu individuapromena = varijabilitet

  • Mere varijabilnosti?RasponStandardna devijacijaVarijansa

  • Zajedniko variranje?KovarijansaMera osetljiva na merne jedinicePromena merne jedinice na istim podacima drastino menja iznos kovarijanseNpr: povezanost visine (m) i teine (kg) reda veliine 1povezanost visine (cm) i teine (g) reda veliine 100 000

  • Brejv (Bravais)Pirson (Pearson)Koeficijent korelacije

  • Pirsonov koeficijent korelacijeKarl PearsonStandardizovanje kovarijanse-1 < r < 1

  • Neke kritine vrednostir =1r=-1r=0

    Chart1

    1

    2

    3

    4

    5

    Sheet1

    11

    22

    33

    44

    55

    15

    24

    33

    42

    51

    13

    25

    31

    45

    53

    Sheet1

    Sheet2

    Sheet3

    Chart2

    5

    4

    3

    2

    1

    Sheet1

    11

    22

    33

    44

    55

    15

    24

    33

    42

    51

    13

    25

    31

    45

    53

    Sheet1

    Sheet2

    Sheet3

    Chart3

    3

    5

    1

    5

    3

    Sheet1

    11

    22

    33

    44

    55

    15

    24

    33

    42

    51

    13

    25

    31

    45

    53

    Sheet1

    Sheet2

    Sheet3

  • Korelacija kosinus uglaKorelacija - bliskost dva vektora vektori varijabli u prostoru ispitanikaAko su: varijable meusobno slinije ugao koji zaklapaju vektori je manji kosinus ugla je vei

  • drueljubivostcos < cos:drueljubivost slinija otvorenosti nego IQu

  • Povezanost na grafikonu je:jaka slaba?pozitivna negativna?linearna nelinearna?

  • Intenzitet i smer korelacije

  • Povezanost na grafikonu je:jaka slaba?pozitivna negativna?linearna nelinearna?

  • Nelinearnost korelacije

  • Povezanost na grafikonu je:jaka slaba?pozitivna negativna?linearna nelinearna?

  • Outlier

  • Korelacija i kovarijansaKovarijansa nije ograniena, koeficijent korelacije jeste, od -1 do 1Kovarijansa zavisi od mernih jedinica, korelacija neUvek su istog predznakaKada su dve varijable statistiki nezavisne, kovarijansa i koeficijent korelacije su 0, ali OBRNUTO NE VAI!

  • Znaajnost korelacijeStudentov t-testStudentova distribucija uzorkovanjaHo nema povezanostip
  • Distribucija uzorkovanja t-statistikaNeka je u izvedenom istraivanju t=2.3Ukoliko nema povezanostip verovatnoa da se, ukoliko u populaciji ne postoje povezanost, na uzorku dobiju vrednosti za t, jednake ili vee od 2.3Ako je p malo, mala je verovatnoa da nema povezanosti u populaciji

  • Statistika znaajnostStatistika znaajnost (p) verovatnoa da mereni statistik bude jednak ili vei od dobijene vrednosti, a da u populaciji nema razlikaUslovno: verovatnoa da u populaciji nema povezanosti, tj verovatnoa tanosti Ho

  • Intervali poverenja za rPretvaranje koeficijenta r u Fierov zz ima standardizovanu normalnu raspodeluRaunanje standardne greke za ZF

    Donja i gornja granica intervalaZF+/-1.96*SEZFZF+/- 2.58*SEZFVraanje ZF u r

  • Povezanost - uzronost?

  • ta moe znaiti korelacija izmeu X i Y?ZZZZ

  • Da li korelacija znai uzronost?BESMISLENE KORELACIJE: Hemline Index to su krae suknje devojaka, cene na tritu su vieto se vie sladoleda proda, vei je broj napada ajkula Verovatnoa da ostanu u drugom stanju je dva puta vea kod ena koje su se molile u crkviVlasnici maina za pranje imaju veu verovatnou da poginu u automobilskoj nesrei

  • Regresiona analizaGolton (Galton)Pirson (Pearson)

  • Regresiona analizaOdnosi izmeu varijablipovezanost XYpredikcijaXYzavisnost XYuzronostXYDefinisati model na osnovu koga se moe manje ili vie precizno preko poznavanja rezultata na prediktorskoj varijabli (x) predvideti rezultat na kriterijumskoj varijabli (y).

  • Od korelacije do predikcijeregresiona linijaNai model (pravu) za koju e biti najmanja odstupanja taaka (empirijske vrednosti) od predvienih (vrednosti na pravoj)Metod najmanjih kvadrata minimalna kvadrirana odstupanjapredvienarealna

  • Od korelacije do predikcijepredvienarealnaregresiona linijaa - interceptb - nagibili

  • Predviene vrednosti na kriterijumuEmpirijski dobijene vrednosti na kriterijumuGreka predvianja (rezidual)Minimum funkcije

  • Od korelacije do predikcijepredvienarealnaregresiona linijaa - interceptb - nagib

  • Koeficijent determinacijer2 = proporcija objanjene varijanse Npr. ako je r2 = 0.9, to znai da 90 % zavisne varijable (Y) moemo predvideti (objasniti) na osnovu (X)Determinacija = kvadrirana korelacija

  • Znaajnost predikcijeStandardna greka ocene = standardna devijacija distribucije rezuduala

    Fierov f statistikSnidikorova distribucija uzorkovanjaHo r2=0 (nema predvianja): p

  • Znaajnost intercepta i nagibaHo: b0=0Statistik t ima studentovu distribuciju uzorkovanjaako je p
  • Znaajnost predikcijeTest znaajnosti koeficijenta determinacije (r2) je isto to i test znaajnosti koeficijenta linearne korelacije (r) f statistik je jednak kvadratu t statistika Test znaajnosti regresionog koeficijenta nagiba je isto to i test znaajnosti koeficijenta linearne korelacijet statistik je jednak t statistiku

  • Veliina efektaVeliina efekata: f2=r2*100 (izraava se kao %)procenat deljene varijansemali efekat do 1% (0.01)srednji efekat oko 9% (0.09)veliki efekat preko 25% (0.25)

  • Predvianje - primenaInterpolacija predvianje vrednosti kriterijumske varijable za vrednosti prediktora koje su u rasponu korienom pri pravljenju modelaEkstrapolacija predvianje vrednosti kriterijumske varijable za vrednosti prediktora koje su izvan raspona korienog pri pravljenju modela

  • korelacija - predikcija

    r=1r2=1r=0.9r2=0.81r=0.8r2=0.64r=0.7r2=0.49r=0.6r2=0.36r=0.5r2=0.25r=0.4r2=0.16r=0.3r2=0.09r=0.2r2=0.04r=0.1r2=0.01

    Chart1

    0.01

    0.04

    0.09

    0.16

    0.25

    0.36

    0.49

    0.64

    0.81

    1

    korelacija

    uzronost

    Sheet1

    0.10.01

    0.20.04

    0.30.09

    0.40.16

    0.50.25

    0.60.36

    0.70.49

    0.80.64

    0.90.81

    11

    Sheet1

    korelacija

    uzronost

    Sheet2

    Sheet3

  • Veliina uzorkaOdrediti nivo znaajnostieljenu snagu statistikog testa (1-)Proceniti veliinu efekata u populacijiPogledati u tablicama ili programu za odreivanje veliine uzorka

  • Uslovi za primenu korelacije i regresijeNormalna raspodela varijabli u populacijinaroito problem ako je jedna varijabla negativno a druga pozitivno asimetrinaObe varijable kvantitativneLinearnost odnosa meu varijablamaZa regresionu analizu: prediktorska varijabla merena bez greke! (gotovo nemogu uslov)

  • Povezanost - uzronost?Konfundirajue varijable (Z)Povezanost predvianje zavisnost uzronostkorelacija povezanostregresija - predvianjeSmer uzronosti?Logika vs raunska uzronost