Statistik -...
-
Upload
dangkhuong -
Category
Documents
-
view
218 -
download
0
Transcript of Statistik -...
1
www.lio.se/fou FoU-enheten för närsjukvården
Statistik
Lars Walter
Fil.lic. Statistik
• Linköping universitet
• Stockholms universitet
• Karolinska sjukhuset
• Sveriges Lantbruksuniversitet
• Linköpings universitet
• Folkhälsocentrum, LiÖ
• FoU-enheten, LiÖ
www.lio.se/fou FoU-enheten för närsjukvården
Statistik
www.lio.se/fou FoU-enheten för närsjukvården
Statistik
2
www.lio.se/fou FoU-enheten för närsjukvården
Statistik
” … vetenskapen om hur data med
inslag av slumpvariation eller
osäkerhet skall insamlas,
utvärderas och presenteras.” (National encyklopedin)
www.lio.se/fou FoU-enheten för närsjukvården
“Statistics,
the most important science in the whole world: for upon it depends the applications of every other science and of every art: the one science essential for all political and social administration, all education, all organization based on experience for it only gives results of our experiences” Florence Nightingale
Statistik
www.lio.se/fou FoU-enheten för närsjukvården
Statistik
I dag
• Grund (skalor och variabler)
• Deskriptiv statistik
• Statistisk inferens (analys)
• Statistisk styrka (poweranalys)
• Sensitivitet och specificitet
3
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Variabler och skalor
Nominalskala
Ordinalskala
Intervallskala
Kvotskala
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Nominal skala
Egenskaper:
Klassificerar objekt till en av flera kategorier
Exempel:
Födelseland, Yrke, etc
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Ordinal skala
Egenskaper:
Naturlig rangordning mellan kategorier
Exempel:
Sf36 fråga1
4
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Ordinal skala
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Nominal skala - alltid diskret
(diskret = kategoridata, klassindelad)
Ordinal skala – ofta diskret
men inte alltid…
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
VAS, Visuell Analog Skala
en kontinuerlig ordinal skala
5
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Intervallskala
Egenskaper:
Ekvidistans
Exempel:
Temperatur (grader Celsius)
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Kvotskala
Egenskaper:
Absolut nollpunkt
Exempel:
Vikt, temperatur (kelvin)
www.lio.se/fou FoU-enheten för närsjukvården
Skalor
Intervall- och kvotskalor kan vara antingen
kontinuerliga eller diskreta
Alla fyra skalorna kan dikotomiseras
6
www.lio.se/fou FoU-enheten för närsjukvården
Variabler och skalor
Vilka variabler kan vi mäta på oss
här inne?
Vilka skalor mäts variablerna med?
www.lio.se/fou FoU-enheten för närsjukvården
Beskrivande mått
Centralmått (lägesmått)
Spridningsmått
Skevhet (skewness)
Toppighet (curtosis)
www.lio.se/fou FoU-enheten för närsjukvården
Beskrivande mått
Centralmått
Typvärde
Median
Medelvärde
7
www.lio.se/fou FoU-enheten för närsjukvården
Beskrivande mått
Spridningsmått
Kvartiler och kvartilavstånd
Min, max och range (vidd)
Standardavvikelse
www.lio.se/fou FoU-enheten för närsjukvården
Beskrivande mått
Nominalskala:Typvärde
Ordinal skala: Median, kvartiler, min och
max, range och kvartilavstånd
Intervall-/kvotskala: Medelvärde,
standardavvikelse
www.lio.se/fou FoU-enheten för närsjukvården
Två formler
1
)(vikelsestandardav
medelvärde
2
n
xx
n
x
8
www.lio.se/fou FoU-enheten för närsjukvården
En övning
Beräkna: typvärde, median och medelvärde samt 1:a
kvartilen och 3:e kvartilen
www.lio.se/fou FoU-enheten för närsjukvården
Descriptives
Statistic Std. Error
VariabelA Mean 1,0000 ,65865
95% Confidence Interval for
Mean
Lower Bound -,3963
Upper Bound 2,3963
5% Trimmed Mean 1,0556
Median 2,0000
Variance 7,375
Std. Deviation 2,71570
Minimum -4,00
Maximum 5,00
Range 9,00
Interquartile Range 4,00
Skewness -,531 ,550
Kurtosis -,586 1,063
En övning
www.lio.se/fou FoU-enheten för närsjukvården
Beskriva med tabeller
Korstabeller kan vara
tvåvägsindelade eller trevägsindelade
och innehålla
absoluta frekvenser eller relativa frekvenser
9
www.lio.se/fou FoU-enheten för närsjukvården
Beskriva med tabeller
Tvåvägstabell med absoluta och relativa
frekvenser
www.lio.se/fou FoU-enheten för närsjukvården
Beskriva med tabeller
Trevägstabell med relativa frekvenser
www.lio.se/fou FoU-enheten för närsjukvården
Beskriva med tabeller
10
www.lio.se/fou FoU-enheten för närsjukvården
Beskriva med tabeller
Trevägsindelad kvottabell (4 variabler)
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
11
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
140 160 180 200
Hur lång är Du?
0
500
1000
1500
Co
un
t
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
140 160 180 200
Hur lång är Du?
0
250
500
750
1000
Co
un
t
man kv inna
140 160 180 200
Hur lång är Du?
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
140 160 180 200
Hur lång är Du?
0%
10%
20%
30%
Perc
en
t
man kv inna
140 160 180 200
Hur lång är Du?
12
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
man kvinna
Kön (register)
140
150
160
170
180
190
200
Hu
r lå
ng
är
Du
?
13
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
man kvinna
Kön (register)
140
160
180
200
Hu
r lå
ng
är
Du
?
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
14
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
,7% 2,4%
43,0% 54,9%
43,9% 28,8%
12,4% 13,9%
100,0% 100,0%
Underv ikt, BMI under 18,5
Normalv ikt, BMI mellan
18,5 och 25
Överv ikt BMI mellan 25
och 30
Fetma, BMI över 30
Total
BMI-klass
Man Kv inna
Kön
15
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
Undervikt Normalvikt Övervikt Fetma
BMI-klass
10%
20%
30%
40%
50%
Perc
en
t
man kv inna
Undervikt Normalvikt Övervikt Fetma
BMI-klass
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
man
kvinna
Kön (register)
Undervikt Normalvikt Övervikt Fetma
BMI-klass
5%
10%
15%
20%
25%
Perc
en
t
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
Arbetat inklusive föräldralediga med tjänst
Studerat
Arbetslös/arbetsmarknadsåtgärd
Pensionär med deltidsarbete/eget företag
Ålderspensionär/avtalspension
Sjukskriven/sjukersättning
Annat
Sysselsättning (7 kategorier)
man kv inna
16
www.lio.se/fou FoU-enheten för närsjukvården
0
20
40
60
80
100
Man Kvinna
Förvilla inte !
www.lio.se/fou FoU-enheten för närsjukvården
0
10
20
30
40
50
60
Man Kvinna
Förvilla inte !
www.lio.se/fou FoU-enheten för närsjukvården
Förvilla inte !
17
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
Statistikens bilder
www.lio.se/fou FoU-enheten för närsjukvården
statistisk inferens, induktiv vetenskap där man drar
slutsatser ur empiriska data under en osäkerhet
orsakad av slumpmässighet i data. Systematisk och
slumpmässig variation i data beskrivs i en statistisk
modell (t.ex. en regressionsmodell) med en eller flera
okända ...
Nationalencyklopedin
Statistisk inferens
18
www.lio.se/fou FoU-enheten för närsjukvården
Statistisk inferens
Population
Stickprov
Medelvärde: μ
Standardavvikelse: σ Medelvärde: x
Standardavvikelse: s
_
www.lio.se/fou FoU-enheten för närsjukvården
Statistisk inferens
Population
Behandling A
Population
Behandling B
Medelvärde: μA
Standardavvikelse: σA
Medelvärde: μB
Standardavvikelse: σB
Stickprov Stickprov
xA
sA
_ xB
sB
_
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning:
Ett centralt begrepp i statistisk
inferens
Statistisk inferens
19
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
medelvärde=54.9
Samplingfördelning
20
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
medelvärde=54.9
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
21
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
22
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
23
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
24
www.lio.se/fou FoU-enheten för närsjukvården
Centrala gränsvärdessatsen
Ungefär så här:
Om populationen är normalfördelad så blir
samplingfördelningen för stickprovsmedelvärdet också
normalfördelad
Om populationen är symmetrisk så blir
samplingfördelningen för stickprovsmedelvärdet nästan
normalfördelad vid ganska liten stickprovsstorlek
Om populationen inte är symmetrisk så blir
samplingfördelningen för stickprovsmedelvärdet nästan
normalfördelad vid ganska stor stickprovsstorlek
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
25
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
Temperatur i en population
www.lio.se/fou FoU-enheten för närsjukvården
Samplingfördelning
www.lio.se/fou FoU-enheten för närsjukvården
Standardavvikelse eller standard
error eller både och?
n
2x-x
enpopulation i vikelseStandardav
1
x-xtstickprove i vikelseStandardav
2
ns
ns med uppskattas
ntmedelvärdestickprovsför error Standard
26
www.lio.se/fou FoU-enheten för närsjukvården
Hypotesprövning
www.lio.se/fou FoU-enheten för närsjukvården
Typiskt statistisk frågeställning:
Är medelvärdet i den här populationen högre än 37
grader?
Ställ upp statistiska hypoteser
Ta ett stickprov
Beräkna en testvariabel
Räkna ut ett p-värde.
Dra slutsats.
Hypotesprövning
www.lio.se/fou FoU-enheten för närsjukvården
37:
37:
1
0
H
H
37:
37:
1
0
H
H
Statistiska hypoteser
till grund för varje p-värde finns en statistisk
hypotes
Exempel
Hypotesprövning
eller
27
www.lio.se/fou FoU-enheten för närsjukvården
P-värde
sannolikheten att, om nollhypotesen är sann,
observera något som avviker mer från
nollhypotesen än den observation som vi har fått
Hypotesprövning
79
P-value
Probability of obtaining a test statistic at least as extreme as the one that was
actually observed, given that the null hypothesis is true
www.lio.se/fou FoU-enheten för närsjukvården
37:
37:
1
0
H
H
Nu vill vi undersöka om den genomsnittliga
temperaturen i en population är högre än 37
grader. Ett stickprov ur populationen (n=16)
resulterar i stickprovsmedelvärdet 37,3 och
stickprovets standardavvikelse är 0,5
Statistiska hypoteser
Hypotesprövning
www.lio.se/fou FoU-enheten för närsjukvården
Hypotesprövning
3,37x
Samplingfördelningen när nollhypotesen är sann
28
www.lio.se/fou FoU-enheten för närsjukvården
4,2
45,0
0,373,370
ns
HxtTestvariabel:
Är 2,4 tillräckligt stort för att förkasta
nollhypotesen?
Se på p-värdet:
Är p-värdet tillräckligt litet för att förkasta
nollhypotesen?
015,0p
Hypotesprövning
Är 37,3 tillräckligt stort för att förkasta nollhypotesen?
www.lio.se/fou FoU-enheten för närsjukvården
Hypotesprövning
Hur litet ska p-värdet vara?
< 0.20
< 0.10
< 0.05
eller
< 0.01
www.lio.se/fou FoU-enheten för närsjukvården
Kan man dra fel slutsats?
Javisst
Hypotesprövning
29
www.lio.se/fou FoU-enheten för närsjukvården
Nollhypotesen
förkastas
Nollhypotesen
förkastas inte
Nollhypotesen är
sann
Nollhypotesen inte
är sann
Rätt
Rätt
Typ I-fel
(α)
Typ II-fel
(β)
Hypotesprövning
www.lio.se/fou FoU-enheten för närsjukvården
ningenpunktskattför medelfel
ningpunktskatteltestvariab 0H
ningenpunktskattför medelfeletkonstantningpunktskatt
Konfidensintervall för µ (populationsmedelvärdet)
Statistisk inferens
Hypotesprövning: 37: 37: 10 HH
www.lio.se/fou FoU-enheten för närsjukvården
Konfidensintervall
Uppskatta populationens medelvärde med
stickprovets medelvärde (37,3)
eller bättre med ett (95%-igt) konfidensintervall
n
setabellvärdx
4
5,013,23,37 37,03-37,57
4,2
45,0
0,373,370
ns
Hxt
30
www.lio.se/fou FoU-enheten för närsjukvården
Konfidensintervall
Konfidensintervallet tolkas:
Med 95% säkerhet innefattar (täcker) intervallet
den populationsparameter vi är intresserade av.
www.lio.se/fou FoU-enheten för närsjukvården
Power - Styrka
Power-beräkningar är ett stöd inför planering och
design av en studie
• En liten studie kan vara oetisk eller meningslös
• En stor studie kan vara oetisk eller onödigt stor
• En bra power-beräkning kräver en del antagande
och därför kunskap om det som ska studeras
Statistisk styrka:
Sannolikheten att förkasta en felaktig noll-hypotes
www.lio.se/fou FoU-enheten för närsjukvården
Beräkna stickprovsstorlek
1. Vilken är den minsta kliniskt relevanta effekten/skillnaden som vi vill
upptäcka?
2. Vilka är de statistiska hypoteserna?
3. Vilken signifikansnivå ska användas?
4. Vilken styrka vill vi ha?
5. Hur stor är variationen (standardavvikelsen).
31
www.lio.se/fou FoU-enheten för närsjukvården
Beräkna stickprovsstorlek
• Vilka är de statistiska hypoteserna?
• Vilken signifikansnivå ska användas?
• Vilken styrka vill vi ha?
• Hur stor är variationen (standardavvikelsen)?
5: 5: 10 HH
05,0
90.0Power
10
www.lio.se/fou FoU-enheten för närsjukvården
6 1049,76 784,00
7 262,44 196,00
8 116,64 87,11
10 41,99 31,36
15 10,50 7,84
p
Power
0,90 0,80
Beräkna stickprovsstorlek
www.lio.se/fou FoU-enheten för närsjukvården
0,00
200,00
400,00
600,00
800,00
1000,00
1200,00
5 7 9 11 13 15 17
n
μp
Beräkna stickprovsstorlek
32
www.lio.se/fou FoU-enheten för närsjukvården
Power - Styrka
Power-beräkningar kan vara lite besvärliga
att göra för hand
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet:
Sannolikheten att klassificera en sjuk
person som sjuk.
Specificitet:
Sannolikheten att klassificera en frisk
person som frisk.
Sensitivitet och specificitet
www.lio.se/fou FoU-enheten för närsjukvården
Ett exempel: Kroppstemperaturen i en frisk befolkning är i genomsnitt 37
grader med en standardavvikelse på 0,5 grader
Sensitivitet och specificitet
Specificitet
33
www.lio.se/fou FoU-enheten för närsjukvården
forts. exempel: Kroppstemperaturen i en sjuk befolkning är i genomsnitt
38,5 grader med en standardavvikelse på 2,5 grader
Sensitivitet och specificitet
Sensitivitet
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet och specificitet
www.lio.se/fou FoU-enheten för närsjukvården
Temp. Sensitivitet Specificitet
38 0,69 0,98
Sensitivitet och specificitet
34
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet och specificitet
www.lio.se/fou FoU-enheten för närsjukvården
Temp. Sensitivitet Specificitet
37,5 0,84 0,84
38,0 0,69 0,98
38,5 0,50 1,00
Sensitivitet och specificitet
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet: Sannolikheten att klassificera en sjuk person som sjuk.
Specificitet: Sannolikheten att klassificera en frisk person som frisk.
)()(
)(
BPAP
AP
)()(
)(
DPCP
DP
Positivt test Negativt test
Sjuka A B
Friska C D
Sensitivitet och specificitet
35
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet och specificitet
För en slumpmässigt vald person ur en population definieras:
• Sannolikheten att personen är sjuk (Prevalens)
• Sannolikheten för sjukdom efter positivt test (Positivt prediktivt värde)
• Sannolikheten för frisk efter negativt test (Negativt prediktivt värde)
)1()1( prevspecprevsens
prevsensPpv
prevsensprevspec
prevspecNpv
)1()1(
)1(
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet och specificitet
Ett exempel:
I en studie för att bestämma sensitivitet och specificitet för en ny diagnostisk metod ingår 100 personer med den aktuella sjukdomen och
100 friska personer.
Positivt test Negativt test Totalt
Sjuka 90 10 100
Friska 30 70 100
Totalt 120 80 200
sensitivitet: 90 %
specificitet: 70%
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet och specificitet
Screening av sjukdomsförekomst
Vid screening kan man vara intresserad av att beräkna följande:
Andel personer i befolkningen som kommer att behandlas=
Positivt prediktivt värde=
Negativt prediktivt värde=
Andel personer i befolkningen som felaktigt behandlas (falska positiva)=
Andel personer i befolkningen som felaktivt inte behandlas (falska negativa)=
36
www.lio.se/fou FoU-enheten för närsjukvården
Sensitivitet och specificitet
Exempel
I en liten befolkning (100 000 personer) är prevalensen för en viss sjukdom 5 %. Ett
diagnostiskt instrument har sens.=90 % och spec.=70%.
Positivt test Negativt test Totalt
Sjuka 4500 500 5000
Friska 28500 66500 95000
Totalt 33000 67000 100000
Beräkna:
Andel personer i befolkningen som kommer att behandlas = 33000/100000 = 33%
Positivt prediktivt värde = 4500/33000 = 13.6%
Negativt prediktivt värde = 66500/67000 = 99.3%
Andel personer i befolkningen som felaktigt behandlas = 28500/100000 = 28.5%
Andel personer i befolkningen som felaktivt inte behandlas = 500/100000 = 0.5%
www.lio.se/fou FoU-enheten för närsjukvården
www.lio.se/fou FoU-enheten för närsjukvården
20 20
16 24
Det stora
sjukhuset
Det lilla
sjukhuset
Med kompl. Utan kompl.
Simpsons paradox
50 % kompl.
40 % kompl.
37
www.lio.se/fou FoU-enheten för närsjukvården
Simpsons paradox
2 8
9 21
Det stora
sjukhuset
Det lilla
sjukhuset
Med kompl. Utan kompl.
18 12
7 3
Det stora
sjukhuset
Det lilla
sjukhuset
Ej a
ku
t A
ku
t
20 % kompl.
30 % kompl.
60 % kompl.
70 % kompl.
www.lio.se/fou FoU-enheten för närsjukvården
Simpsons paradox
Resultat Sjukhus
Akut/ej
akut