3. Analytisk statistik - pingpong.ki.se · Estimering Med hjälp av slumpmässigt dragna stickprov...

Analytisk Analytisk statistikstatistikTony Pansell, optikerUniversitetslektor

Analytisk statistik

Att dra slutsatser från det insamlade materialet. Två metoder:

1. att generalisera från en mindre grupp mot en större grupp – estimering

2. att jämföra grupper mot varandra och dra slutsatsen om någon grupp avviker – hypotesprövning

Estimering

� Med hjälp av slumpmässigt dragna stickprov uppskattar (estimerar) vi hur det ser ut i de populationer varifrån stickproven är tagna.

Statistisk interferens

Analys av stickprovet ger oss information om populationen, förutsatt att:

� stickprovet är tillräckligt stort� slumpmässigt utvalt från populationen� normalfördelat

Statistisk interferens

Exempel på estimering

Man vill veta hur mycket svenska 10-åringar tittar på Tv per dag.� Ur populationen ”alla 10-åringar” görs ett urval och ur detta dras

ett stickprov.� Dessa intervjuas om hur länge de tittar på Tv.� Medelvärdet för detta stickprov var 2,6 timmar.� 95% konfidensintervall ger gränserna 2,4 till 2,8 tim.

� Med 95% sannolikhet ser en svensk 10-åring mellan 2,4-2,8timmar på Tv per dag.

2,6 2,4 2,8

punktestimatnedre gräns övre gräns

Hypotesprövning

� Istället för att enbart estimera hur det ser ut i populationen försöker vi att statistiskt pröva hypoteser om populationen som stickprovet kommer ifrån.

Nollhypotes (H0)� Ett antagande om ingen skillnad eller inget samband. Att

slumpen är orsaken till det erhållna värdet.

Alternativhypotes (H1) (forskningshypotesen)� Ett antagande om att det finns en skillnad eller ett samband. Att

det finns en annan orsak än slumpen till det erhållna värdet.

Hypotesprövning

� Den grundläggande frågan är alltid om vårt stickprovsresultat gäller generellt (i populationen) eller är ett resultat av slumpmässiga variationer.

� Vi behöver en metod för att hantera osäkerheten i en urvalsundersökning.

� Hypotesprövningen testar om slumpverkan kan ses som orsaken till forskningsresultatet.

� Vi testar hypotesens giltighet genom en sannolikhetsberäkning.

Sannolikhetsteorin

Hur beter sig ett slumpmässigt stickprov i förhållande till populationen?

⇓

Ett stickprovsmedelvärdet varierar från stickprov till stickprov, men i genomsnitt är det samma som

populationsmedelvärdet (om stickprovet är slumpmässigt).

Osannolikhet

� Vi kan välja att definiera en ”osannolik händelse” som en händelse som bara inträffar 5 av 100 gånger om H0 är sann (oftare om den är falsk).�variationer inom konfidensintervall beror sannolikt på

slumpen�variationer utanför konfidensintervall beror osannolikt på

slumpenjättenormalt (jättesannolikt)

normalt (sannolikt)

mindre normalt (mindre sannolikt)

osannolikt

Signifikansnivån

� Sannolikheten / risken att dra fel slutsats bestäms genom signifikansnivån α (alfa)

� Ofta accepteras 5% risk att slumpen orsakat resultatet.

� Vi anger accepterad risknivå (signifikansnivå) för att begå fel i tolkningen av resultatet�exempel: α=5% ger ett 95% konfidensintervall�exempel: α=1% ger ett 99% konfidensintervall

Slumpmässiga fel

Sant negativFalskt negativLika

Falskt positivSant positivSkillnad

LikaSkillnad

Test

VerklighetenTyp I fel

Typ II fel

Typ I och typ II fel

� Vi riskerar alltid att begå ett misstag i vårt antagande� typ I-fel: förkastar nollhypotesen trots att den är sann (vi

finner en falsk skillnad)� typ II-fel: accepterar nollhypotesen trots att den är falsk (vi

missar en äkta skillnad)

� Hur stor risk är vi beredda att ta?�högt α-värde ⇒ risk för typ I-fel� lågt α-värde ⇒ risk för typ II-fel

Exempel på parvis jämförelse

� Vi vill undersöka om forin är samma på avstånd och nära.�H0: Forin påverkas inte av fixationsavståndet.�H1: Forin har inte samma vinkel på långt och nära avstånd.

Frekvensdiagram på forivärden

Histogram

PCT på avstånd och nära före behandling

PCT 1 LH PCT 1 NH

0 1 2 3 4 5 6 7 8 9 10 11 120

1

2

3

4

5N

o of

obs

PCT 1 LH: N = 17; Mean = 4,1176; StdDv = 3,4257; Max = 12; Min = 0 PCT 1 NH: N = 17; Mean = 11,8824; StdDv = 4,7682; Max = 18; Min = 4

HistogramPCT på avstånd och nära före behandling

PCT 1 LH PCT 1 NH

0 1 2 3 4 5 6 7 8 9 10 11 120

1

2

3

4

5N

o of

obs

Frekvensdiagram med normalkurvor på forivärden

Histogram


PCT 1 LH PCT 1 NH

0 1 2 3 4 5 6 7 8 9 10 11 120

1

2

3

4

5N

o of

obs

PCT 1 LH: N = 17; Mean = 4,1176; StdDv = 3,4257; Max = 12; Min = 0 PCT 1 NH: N = 17; Mean = 11,8824; StdDv = 4,7682; Max = 18; Min = 4

Har forin samma vinkel på avstånd och nära?

Kan skillnaden i forimätningarna uppstått av slumpen ?Histogram


PCT 1 LH PCT 1 NH

0 1 2 3 4 5 6 7 8 9 10 11 120

1

2

3

4

5N

o of

obs

Har forin samma vinkel på avstånd och nära?

Kan skillnaden i forimätningarna uppstått av slumpen ?

Medel -95% KI +95% KI

Histogram


PCT 1 LH PCT 1 NH

0 1 2 3 4 5 6 7 8 9 10 11 120

1

2

3

4

5N

o of

obs

PCT 1 LH 4,11 2,36 5,87 3,42 -2,59 10,83PCT 1 NH 11,88 9,43 14,33 4,77 2,54 21,23

Vi behöver göra en statistisk analys!

Medel-95% KImedelv.

+95% KImedelv. SD

-95% KIfördeln.

+95% KIfördeln.

Statistiska tester

Utgår från: � typen av data� om data är normalfördelat eller inte � hur många grupper som ska jämföras

Lite begrepp

� Variabel : något som kan variera hos vår population� Resultatvariabel : anger resultatet, det vi är intresserade av� Förklaringsvariabel : det som beskriver vår population, vi väljer

själva� Beroende data : inom grupp/individ (dependent, paired)� Oberoende data : mellan grupp/individer (independent)� Ensidigt / Tvåsidigt test (one-tailed / two-tailed)

Ensidigt och tvåsidigt test

� Ett ensidigt test kan användas om man med säkerhet vet att en eventuell förändring bara kan gå i en viss riktning

� Om man inte vet i vilken riktning en förändring kan gå, måste ett tvåsidigt test väljas. Om man tvivlar ⇒ tvåsidigt test

T-test

� Förhållande mellan en eller två kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel)

� Resultatvariabeln alltid på y-axeln� Kräver kvalitativ normalfördelad data

� Analysera dataset: tårmenisk

läng

d (m

)

män kvinnor

ANOVA – analysis of variance

� Förhållandet mellan tre eller fler kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel)

� Resultatvariabeln alltid på y-axeln� Kräver kvalitativ normalfördelad data

� Analysera dataset: LUSvärde

inko

mst

(kr

)

läkare ingenjör pilot

Chi-2 / Fisher Exakt test

Korstabellanalys av data på nominalskale-nivå

� alt.1 Analyserar observerade frekvenser (O) vilka jämförs med förväntade frekvenser (E)

� alt.2 Jämför två grupper mot varandra som inte är matchade (ej beroende av varandra)

� Analysera dataset: stud Sthlm-Kalmar

Regression

� Regression – sambandet mellan två eller fler kontinuerliga variabler (ex. ålder, längd, blodtryck)

� Analysera dataset: Frukten

glas

sför

säljn

ing

vattentemperatur

Vilka statistiska metoder korrelerar med varandraParametriska metoder Icke parametriska metoderSkillnader mellan oberoende grupperT-test för oberoende data ⇒⇒⇒⇒ Mann-Whitney test (2 oberoende stickprov)ANOVA/MANOVA ⇒ Kruskal-Wallis test (≤ 3 oberoende)

Skillnader mellan beroende grupperT-test för beroende data ⇒⇒⇒⇒ Wilcoxon's matched pairs testANOVA ⇒⇒⇒⇒ Friedman's test

Samband mellan variablerKorrelations koefficient ⇒⇒⇒⇒ Spearman

Kategorisk data (ingen motsvarighet i parametriska)Chi-square test the Phi coefficient the Fisher exact test

Tolkning av resultat – signifikans (p)

� Testfunktionen: p-värdet (p-value) anger sannolikheten för slumpens påverkan eller risken att förkasta nollhypotesen om den vore sann.

� När sannolikheten för ett slumpmässigt resultat är mindre än α-värdet är resultatet signifikant. Det finns en skillnad.

� p-värdet är mindre än 5%.� Ex. Jämförelsen av konvergensnärpunkt hos elever med läsbesvär

med elever utan besvär var signifikant (p=0,002). Elever med besvär uppvisade en genomsnittlig knp på 17 (±5) cm medan elever utan besvär uppvisade en normal knp (7 (±2) cm (Pansell et al., 2002).

Power

� Power (styrkan) hos ett test är ett mått på hur bra det är på att förkasta nollhypotesen om den är falsk.

� Power = förmågan att säga att det inte är slumpen när det verkligen inte är slump som orsakat skillnaderna mellan grupperna.

� Styrkan ökar med ökat antal N� Styrkan minskar när alfanivån sjunker (ex från 0,05 till 0,01)� Behålles H-noll kan det bero på att H-noll är sann eller att

experimentet har låg styrka (power)

Analytisk Analytisk statistikstatistikTony Pansell, optikerUniversitetslektor

3. Analytisk statistik - pingpong.ki.se · Estimering Med hjälp av slumpmässigt dragna stickprov...

Documents

Transcript of 3. Analytisk statistik - pingpong.ki.se · Estimering Med hjälp av slumpmässigt dragna stickprov...