Sõltumatud muutujad korreleeruvad omavahel - tekib võimalus “vahendatud korrelatsiooniks”

Post on 08-Jan-2016

97 views 0 download

description

mustad. valged. isased. 20 vaatlust. 2 vaatlust. emased. 3 vaatlust. 24 vaatlust. Sõltumatud muutujad korreleeruvad omavahel - tekib võimalus “vahendatud korrelatsiooniks” - kinganumber ja tarbitud toit – teame, mis mõjutab; - kehasuurus ja mao suurus – ei tea, mis mõjutab; - PowerPoint PPT Presentation

Transcript of Sõltumatud muutujad korreleeruvad omavahel - tekib võimalus “vahendatud korrelatsiooniks”

Sõltumatud muutujad korreleeruvad omavahel

- tekib võimalus “vahendatud korrelatsiooniks”- kinganumber ja tarbitud toit – teame, mis mõjutab;- kehasuurus ja mao suurus – ei tea, mis mõjutab;

- kaks pidevat muutujat;- pidev ja kategooriline;- kaks kategoorilist - mittetasakaaluline ANOVA:

 

  

 mustad

 valged

 isased

 20 vaatlust

 2 vaatlust

 emased

 3 vaatlust

 24 vaatlust

 

Taime pikkus sõltuvana

1) temperatuurist;2) niiskusest

Mängime, et temperatuur ja niiskus korreleeruvad omavahel,nt elame kuskil kõrbe lõunaserval:

0 10 20 30 40 50 60 70 80 90

niiskus

15

20

25

30

temperatuur

0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0n i is kus

0

1 0

2 0

3 0

4 0

5 0

6 0

7 0

8 0

taim

Ühekaupa asja uurides pole kahtlust, et taime pikkus sõltubnii niiskusest kui ka temperatuurist,

aga kas niiskusel on sellist mõju, mis pole temperatuuri mõjuga seletatav?

aga kas temperatuuril on sellist mõju, mis pole niiskusemõjuga seletatav?

.... paneme nad nüüd ühte ANOVA mudelisse sõltumatuteks muutujateks, aga mitu eri varianti.... SS jagamine….

1 2 1 4 1 6 1 8 2 0 2 2 2 4 2 6 2 8 3 0 3 2 3 4tem p

0

1 0

2 0

3 0

4 0

5 0

6 0

7 0

8 0

taim

Type I analüüs ehk type I sums of squareskannab kogu halli osa selle arvele,

kes mudelis esimesena, hindab maksimaalset mõju;tesie faktori suhtes konservatiivne - mis “päriselt kindlasti

tema oma”, hindab minimaalset mõju. Niiskus esimeseks:

DF Type I SS F P niiskus 1 2164 32.30 0.0023temperatuur 1 142 2.13 0.2045

.... ei saa väita, et temperatuuril oleks niiskusest sõltumatu mõju.

Temperatuur esimeseks:

Source DF Type I SS F p temperatuur 1 1886 28.1 0.0032niiskus 1 420 6.28 0.0541Ei saa ka väita niiskuse temperatuurist sõltumatut mõju (kuigi napilt),

Ja nüüd type III – konservatiivne mõlema suhtes!

DF Type III SS F P temperatuur 1 142.5 2.13 0.2045niiskus 1 420.8 6.28 0.0541

Type I muutujate järjekord olulune, type III mitte!

III tüüpi analüüsi oht - see ühine seletav jõud jääb leidmata!

Tee enda jaoks mitut moodi,esita aga type III kui see peegeldab tõde adekvaatselt!

Muidu pead seletama.

Kui ei korreleeru (on tasakaaluline) siis pole vahet!

Ka ühefaktorilise puhul mitte!

Type II ja IV kah olemas.

Väldi kui võimalik, aga alati ei saa!

Kovariatsioonanalüüs katses -otsene ja kaudne mõju.

Röövikute rühmas elamise mõju liblika viljakusele,kehakaalu kaudu või veel midagi?

Kaalu kaasamine kovariaadiks!Kovariaadi kaasamisel sisuline tähendus – küsimus muutub!

Ära tee seda, kui kaalud treati väga erinevad!

manipulatsioon:rühmas kasvatamine

nukukaal

liblikaviljakus

Mitmene regressioon

pikkus = 0,597*temp + 0,089*valgus + 0,196*niiskus - 0.12

Mittelineaarne regressioony = sin(ax + c(log(x))bx

- millist siis sobitame?- ette teada?

- mida järeldame?- funktsiooni enda omadused, mitte andmete omad.- kirjeldamaks OK.

Enamasti piisab, kui uurime, kas hälbib lineaarsusest.- kaasame ruutliikme: positiivne ja negatiivne;- sobitame parabooli.

0 2 4 6 8 10 12

x

0

6

12

18

y

y = 0,27x2+1,55x+3,6

II tüüpi regressioon:

- kui tahame järeldada midagi tõusu väärtusest;- esimest tüüpi regressioon ennustamise tarbeks, mitte tõenäoseima seose hindamise tarbeks;- eri pidi ennustamiseks erinevad sirged!

Võrrand ei sõltu sellest, kumb muutuja on kummal teljel!

Geometric mean regression- mõlematpidi tõusude geomeetriline keskmine;

- kui huvitab vaid seose olemasolu, pole vahet, milline regressioon!

-ANOVA variatsioonid:

- hierahiline;

- juhuslike faktoritega;

- korduvmõõtmistega;

Hierarhiline ANOVA

ühe faktori mõjudel “lubatakse” erineda teise faktori eri tasemetel - klass ja kool;

üks faktor on teisele allutatud - nested. sulgudesse: B(A), klass(kool)

Kas sabasule pikkus sõltub soost:tavaliselt:

DF Type III SS F P sugu 1 0.333 0.05 0.82liik 1 0.333 0.05 0.82

aga nüüd sugu allutatud (... nested) liigile  

liik 1 0.333 0.16 .69sugu(liik) 2 40.66 9.76 .0071

.... alampopulatsioonid, katsedisain, kovariaadid.

Juhuslike faktoritega dispersioonanalüüs

juhuslik (random) faktor on selline muutuja, mille katses esindatud tasemed on vaadeldavad valimina suurest tasemete populatsioonist.

- pesakond

Fikseeritute kõik tasemed on katses esindatud:- treatment;- sugu.

Juhusliku puhul on juhuhajuvus mitmetasandiline:- üksikvaatluste hajuvus ümber pesakonna keskmise;- pesakondade hajuvus ümber pesakondade keskmise.

Uurime tamme lehe suuruse sõltuvust uurimisala temperatuurist.

Millised on juhuslikud:- puu isend;- oks puus;- aastaaeg;- metsatukk;- biotoop (mets/ avamaa);- aasta.

Võib sõltuda probleemipüstitusest:kas uurime erinevust just nende populatsioonide vahel või

tahame tulemusi üldistada kõigile populatsioonidele.

Kui on random, on üldistatav!

I ja II tüüpi ja mixed ANOVA

ühefaktorilise puhul pole vahet;

Kahefakroriline (üks juhuslik ja üks fixed)

vahe on enamasti väike, kui koosmõjusid pole;

koosmõjudega läheb vahe suureks!

- 6 pesakonda, 2:4, kuidas kogu populatsioonis? Ei tea.

erinevus puudutab pigem just seda, mis ise pole juhuslik!

manipulatsioon

pesakond a b

mõju

1 1 2 +1

2 1 -4 -5

3 3 3,7 +0,7

4 3 4,3 +1,3

5 4 -0,3 -4,3

6 4 5 +1

pesakond fikseeritud: Type 3 Tests of Fixed Effects  Num Den Effect DF DF F Value Pr > F trea 1 24 6.10 0.0211pesa 5 24 23.70 <.0001trea*pesa 5 24 11.12 <.0001 

manipulatsioon

pesakond a b

mõju

1 1 2 +1

2 1 -4 -5

3 3 3,7 +0,7

4 3 4,3 +1,3

5 4 -0,3 -4,3

6 4 5 +1

pesakond juhuslik: Type 3 Tests   Num Den Effect DF DF F Value Pr > F trea 1 24 0.55 0.4924pesa 5 24 2.13 0.213trea*pesa 5 24 11.12 <.0001 

manipulatsioon

populatsioon a b

mõju

1 1 2 +1

2 1 2 +1

3 3 3,7 +0,7

4 3 4,3 +1,3

5 4 4 0

6 4 5 +1

pesakond fikseeritud: Type 3 Tests of Fixed Effects  Num Den Effect DF DF F Value Pr > F trea 1 24 7.76 0.0103pesa 5 24 12.31 <.0001trea*pesa 5 24 0.39 0.8486

pesakond juhuslik: Type 3 Tests   Num Den Effect DF DF F Value Pr > F trea 1 24 19.74 0.0067pesa 5 24 31.32 0.0009trea*pesa 5 24 0.39 0.8486

manipulatsioon

populatsioon a b

mõju

1 1 2 +1

2 1 2 +1

3 3 3,7 +0,7

4 3 4,3 +1,3

5 4 4 0

6 4 5 +1

- ei ole alati õiget ja valet;

- peaks olema palju;

- peab ikka grupeerima üksikvaatlusi, mitte vaatlus ise olema!

kaal populatsioon (random)

treatment (fixed)

3,2 a X

4,8 a Z

5,9 a X

4,6 b Z

5,6 b X

9,8 b Z

3,3 b X

8,4 b Z

6,6 c X

5,8 c Z

2,7 c X

Korduvmõõtmistega ANOVA

- ühte isendit (või muud asja) on mõõdetud mitu korda;Ei tohi tavaliselt:

- hindame vabadusastmeid üle – pseudoreplikatsioonid!;- ei võta individuaalsust arvesse.

Mõlema vastu aitab REPEATED measurements ANOVA:

1. Sõltuvate valimite t-test

2. Täide kaalu sõltuvus karu karvkatte paksusest.

3. Linde söödetakse eri taimedega ja uuritakse parasiitide ohtrust,

iga lindu neli korda mõõdetakse, time*trea koosmõju huvitab.