3. Analytisk statistik - pingpong.ki.se · Estimering Med hjälp av slumpmässigt dragna stickprov...
Transcript of 3. Analytisk statistik - pingpong.ki.se · Estimering Med hjälp av slumpmässigt dragna stickprov...
Analytisk Analytisk statistikstatistikTony Pansell, optikerUniversitetslektor
Analytisk statistik
Att dra slutsatser från det insamlade materialet. Två metoder:
1. att generalisera från en mindre grupp mot en större grupp – estimering
2. att jämföra grupper mot varandra och dra slutsatsen om någon grupp avviker – hypotesprövning
Estimering
� Med hjälp av slumpmässigt dragna stickprov uppskattar (estimerar) vi hur det ser ut i de populationer varifrån stickproven är tagna.
Statistisk interferens
Analys av stickprovet ger oss information om populationen, förutsatt att:
� stickprovet är tillräckligt stort� slumpmässigt utvalt från populationen� normalfördelat
Statistisk interferens
Exempel på estimering
Man vill veta hur mycket svenska 10-åringar tittar på Tv per dag.� Ur populationen ”alla 10-åringar” görs ett urval och ur detta dras
ett stickprov.� Dessa intervjuas om hur länge de tittar på Tv.� Medelvärdet för detta stickprov var 2,6 timmar.� 95% konfidensintervall ger gränserna 2,4 till 2,8 tim.
� Med 95% sannolikhet ser en svensk 10-åring mellan 2,4-2,8timmar på Tv per dag.
2,6 2,4 2,8
punktestimatnedre gräns övre gräns
Hypotesprövning
� Istället för att enbart estimera hur det ser ut i populationen försöker vi att statistiskt pröva hypoteser om populationen som stickprovet kommer ifrån.
Nollhypotes (H0)� Ett antagande om ingen skillnad eller inget samband. Att
slumpen är orsaken till det erhållna värdet.
Alternativhypotes (H1) (forskningshypotesen)� Ett antagande om att det finns en skillnad eller ett samband. Att
det finns en annan orsak än slumpen till det erhållna värdet.
Hypotesprövning
� Den grundläggande frågan är alltid om vårt stickprovsresultat gäller generellt (i populationen) eller är ett resultat av slumpmässiga variationer.
� Vi behöver en metod för att hantera osäkerheten i en urvalsundersökning.
� Hypotesprövningen testar om slumpverkan kan ses som orsaken till forskningsresultatet.
� Vi testar hypotesens giltighet genom en sannolikhetsberäkning.
Sannolikhetsteorin
Hur beter sig ett slumpmässigt stickprov i förhållande till populationen?
⇓
Ett stickprovsmedelvärdet varierar från stickprov till stickprov, men i genomsnitt är det samma som
populationsmedelvärdet (om stickprovet är slumpmässigt).
Osannolikhet
� Vi kan välja att definiera en ”osannolik händelse” som en händelse som bara inträffar 5 av 100 gånger om H0 är sann (oftare om den är falsk).�variationer inom konfidensintervall beror sannolikt på
slumpen�variationer utanför konfidensintervall beror osannolikt på
slumpenjättenormalt (jättesannolikt)
normalt (sannolikt)
mindre normalt (mindre sannolikt)
osannolikt
Signifikansnivån
� Sannolikheten / risken att dra fel slutsats bestäms genom signifikansnivån α (alfa)
� Ofta accepteras 5% risk att slumpen orsakat resultatet.
� Vi anger accepterad risknivå (signifikansnivå) för att begå fel i tolkningen av resultatet�exempel: α=5% ger ett 95% konfidensintervall�exempel: α=1% ger ett 99% konfidensintervall
Slumpmässiga fel
Sant negativFalskt negativLika
Falskt positivSant positivSkillnad
LikaSkillnad
Test
VerklighetenTyp I fel
Typ II fel
Typ I och typ II fel
� Vi riskerar alltid att begå ett misstag i vårt antagande� typ I-fel: förkastar nollhypotesen trots att den är sann (vi
finner en falsk skillnad)� typ II-fel: accepterar nollhypotesen trots att den är falsk (vi
missar en äkta skillnad)
� Hur stor risk är vi beredda att ta?�högt α-värde ⇒ risk för typ I-fel� lågt α-värde ⇒ risk för typ II-fel
Exempel på parvis jämförelse
� Vi vill undersöka om forin är samma på avstånd och nära.�H0: Forin påverkas inte av fixationsavståndet.�H1: Forin har inte samma vinkel på långt och nära avstånd.
Frekvensdiagram på forivärden
Histogram
PCT på avstånd och nära före behandling
PCT 1 LH PCT 1 NH
0 1 2 3 4 5 6 7 8 9 10 11 120
1
2
3
4
5N
o of
obs
PCT 1 LH: N = 17; Mean = 4,1176; StdDv = 3,4257; Max = 12; Min = 0 PCT 1 NH: N = 17; Mean = 11,8824; StdDv = 4,7682; Max = 18; Min = 4
HistogramPCT på avstånd och nära före behandling
PCT 1 LH PCT 1 NH
0 1 2 3 4 5 6 7 8 9 10 11 120
1
2
3
4
5N
o of
obs
Frekvensdiagram med normalkurvor på forivärden
Histogram
PCT på avstånd och nära före behandling
PCT 1 LH PCT 1 NH
0 1 2 3 4 5 6 7 8 9 10 11 120
1
2
3
4
5N
o of
obs
PCT 1 LH: N = 17; Mean = 4,1176; StdDv = 3,4257; Max = 12; Min = 0 PCT 1 NH: N = 17; Mean = 11,8824; StdDv = 4,7682; Max = 18; Min = 4
Har forin samma vinkel på avstånd och nära?
Kan skillnaden i forimätningarna uppstått av slumpen ?Histogram
PCT på avstånd och nära före behandling
PCT 1 LH PCT 1 NH
0 1 2 3 4 5 6 7 8 9 10 11 120
1
2
3
4
5N
o of
obs
Har forin samma vinkel på avstånd och nära?
Kan skillnaden i forimätningarna uppstått av slumpen ?
Medel -95% KI +95% KI
Histogram
PCT på avstånd och nära före behandling
PCT 1 LH PCT 1 NH
0 1 2 3 4 5 6 7 8 9 10 11 120
1
2
3
4
5N
o of
obs
PCT 1 LH 4,11 2,36 5,87 3,42 -2,59 10,83PCT 1 NH 11,88 9,43 14,33 4,77 2,54 21,23
Vi behöver göra en statistisk analys!
Medel-95% KImedelv.
+95% KImedelv. SD
-95% KIfördeln.
+95% KIfördeln.
Statistiska tester
Utgår från: � typen av data� om data är normalfördelat eller inte � hur många grupper som ska jämföras
Lite begrepp
� Variabel : något som kan variera hos vår population� Resultatvariabel : anger resultatet, det vi är intresserade av� Förklaringsvariabel : det som beskriver vår population, vi väljer
själva� Beroende data : inom grupp/individ (dependent, paired)� Oberoende data : mellan grupp/individer (independent)� Ensidigt / Tvåsidigt test (one-tailed / two-tailed)
Ensidigt och tvåsidigt test
� Ett ensidigt test kan användas om man med säkerhet vet att en eventuell förändring bara kan gå i en viss riktning
� Om man inte vet i vilken riktning en förändring kan gå, måste ett tvåsidigt test väljas. Om man tvivlar ⇒ tvåsidigt test
T-test
� Förhållande mellan en eller två kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel)
� Resultatvariabeln alltid på y-axeln� Kräver kvalitativ normalfördelad data
� Analysera dataset: tårmenisk
läng
d (m
)
män kvinnor
ANOVA – analysis of variance
� Förhållandet mellan tre eller fler kategorier (förklaringsvariabel) på en kontinuerlig variabel (resultatvariabel)
� Resultatvariabeln alltid på y-axeln� Kräver kvalitativ normalfördelad data
� Analysera dataset: LUSvärde
inko
mst
(kr
)
läkare ingenjör pilot
Chi-2 / Fisher Exakt test
Korstabellanalys av data på nominalskale-nivå
� alt.1 Analyserar observerade frekvenser (O) vilka jämförs med förväntade frekvenser (E)
� alt.2 Jämför två grupper mot varandra som inte är matchade (ej beroende av varandra)
� Analysera dataset: stud Sthlm-Kalmar
Regression
� Regression – sambandet mellan två eller fler kontinuerliga variabler (ex. ålder, längd, blodtryck)
� Analysera dataset: Frukten
glas
sför
säljn
ing
vattentemperatur
Vilka statistiska metoder korrelerar med varandraParametriska metoder Icke parametriska metoderSkillnader mellan oberoende grupperT-test för oberoende data ⇒⇒⇒⇒ Mann-Whitney test (2 oberoende stickprov)ANOVA/MANOVA ⇒ Kruskal-Wallis test (≤ 3 oberoende)
Skillnader mellan beroende grupperT-test för beroende data ⇒⇒⇒⇒ Wilcoxon's matched pairs testANOVA ⇒⇒⇒⇒ Friedman's test
Samband mellan variablerKorrelations koefficient ⇒⇒⇒⇒ Spearman
Kategorisk data (ingen motsvarighet i parametriska)Chi-square test the Phi coefficient the Fisher exact test
Tolkning av resultat – signifikans (p)
� Testfunktionen: p-värdet (p-value) anger sannolikheten för slumpens påverkan eller risken att förkasta nollhypotesen om den vore sann.
� När sannolikheten för ett slumpmässigt resultat är mindre än α-värdet är resultatet signifikant. Det finns en skillnad.
� p-värdet är mindre än 5%.� Ex. Jämförelsen av konvergensnärpunkt hos elever med läsbesvär
med elever utan besvär var signifikant (p=0,002). Elever med besvär uppvisade en genomsnittlig knp på 17 (±5) cm medan elever utan besvär uppvisade en normal knp (7 (±2) cm (Pansell et al., 2002).
Power
� Power (styrkan) hos ett test är ett mått på hur bra det är på att förkasta nollhypotesen om den är falsk.
� Power = förmågan att säga att det inte är slumpen när det verkligen inte är slump som orsakat skillnaderna mellan grupperna.
� Styrkan ökar med ökat antal N� Styrkan minskar när alfanivån sjunker (ex från 0,05 till 0,01)� Behålles H-noll kan det bero på att H-noll är sann eller att
experimentet har låg styrka (power)
Analytisk Analytisk statistikstatistikTony Pansell, optikerUniversitetslektor