PPT Oefenzitting1 Oef-3
-
Upload
raymond-brown -
Category
Documents
-
view
19 -
download
1
Transcript of PPT Oefenzitting1 Oef-3
INIT
IATI
E TOT
HET MEDIS
C
H WETE
NSCHAPPELIJ
K ON
DERZOEK
OE
F EN
ZI T
TI N
G 1
PRAKTISCH
Oplossingen op TOLEDO
INHOUD
Variabelen
Nominaal, ordinaal, numeriek/continu
Kengetallen:
Minimum, maximum, range
Gemiddelde (mean), mediaan, modus
Variantie, standaarddeviatie
Figuren en tabellen
Betrouwbaarheidsinterval
VARIABELEN
Nominaal (categorisch):
- waarden kennen geen rangorde- er is geen meeteenheid- er is geen nulpunt
Ordinaal:
- er is wel een rangorde- er is geen meeteenheid- er is geen nulpunt
Numeriek/continu:
- er is wel een rangorde- er is wel meeteenheid- er is geen (INTERVAL(SCHAAL))/ wel (RATIO/verhoudingschaal) nulpunt: Statistica 11 kent geen verschil!
kwalitatief niveau
kwantitatief niveau
kwalitatief niveau
OEFENING 1
GEEF VOORBEELDEN!
Categorische/nominale variabelen: ???
Ordinale variabelen: ???
Numerieke variabelen: ???
Interval: ???
Ratio: ???
OEFENING 2
BEPAAL HET TYPE VAN DE VOLGENDE VARIABELEN
• de bloedgroep van een mens (O, A, B en AB)
• het hoogste diploma van een persoon
• het aantal verkeersongevallen per jaar op een bepaald kruispunt
• de uitslag van een loopwedstrijd (in volgorde? In tijd?)
• indeling van wielrenners in wel of niet dopinggebruiker
• slagen van een operatie
TYPE GEGEVENS IS BELANGRIJK OMDAT...Met statistische softwares kan men ook
zinloze resultaten bekomen...
CAPTOPRIL DATASET
ID SEX EDU DIA_CHANGE SYS_VOOR DIA_VOOR SYS_NA DIA_NA1 1 1 5 210 130 201 1252 2 2 1 169 122 165 1213 2 2 3 187 124 166 1214 1 3 -2 160 104 157 1065 1 1 11 167 112 147 1016 1 2 16 176 101 145 857 2 1 23 185 121 168 988 1 1 19 206 124 180 1059 2 2 12 173 115 147 103
10 1 2 4 146 102 136 9811 1 3 8 174 98 151 9012 2 2 21 201 119 168 9813 2 3 -4 198 106 179 11014 1 1 4 148 107 129 10315 1 3 18 154 100 131 82
TER HERINNERING
Modus: de meest voorkomende waarde
Mediaan: de middelste van alle waarnemingen (moeten geordend zijn van klein naar groot)
Gemiddelde (mean): de som van alle uitkomsten gedeeld door het aantal waarnemingen
OEFENING 3
BEREKEN HET GEMIDDELDE, DE MODUS EN DE MEDIAAN VOOR ALLE VARIABELEN WAAR HET ZIN HEEFT ZONDER STATISTICA
(tip: Er is een rekenmachine/MS Excel in Windows)
GEMIDDELDE, MEDIAAN EN MODUS MET STATISTICA 11
Werkwijze:
0. Open Statistica 11, de dataset,...
1. Statistics, Basic Statistics/Tables, Descriptive Statistics.
2. Ga naar het tabblad “Advanced”.
3. Selecteer de variabele voor analyse
(e.g. DIA_CHANGE).
4. Selecteer mean, median, modus
STANDAARDDEVIATIE
Variantie en standaarddeviatie (standaardafwijking)
OEFENING 4: BEREKEN DE VARIANTIE EN DE STANDAARDDEVIATIE VAN DIA_CHANGE, DIA_VOOR, DIA_NA, SYS_VOOR, SYS_NA EERST ZONDER EN DAN MET STATISTICA
( )
( )
x x
n
2
1
( )
( )
x x
n
2
1
ANDERE KENGETALLEN
Range: maximum – minimum
Kwantielen:
Q1: 25% links en 75% rechts van Q1
Q2 = mediaan
Q3: 75% links en 25% rechts van Q1
Interkwartielafstand: Q3 – Q1
Percentielen, ...
FIGUREN EN TABELLEN
• Frequentietabel
• Staafdiagram
• Histogram
• Taartdiagram
• Box/whiskerplot
• ...
UITKOMST
3 12.5 12.5 12.5
4 16.7 16.7 29.2
4 16.7 16.7 45.8
6 25.0 25.0 70.8
4 16.7 16.7 87.5
2 8.3 8.3 95.8
1 4.2 4.2 100.0
24 100.0 100.0
2
3
4
5
6
7
8
Total
ValidFrequency Percent
ValidPercent
CumulativePercent
UITKOMST
8765432
Co
un
t
7
6
5
4
3
2
1
0
UITKOMST
8.07.06.05.04.03.02.0
7
6
5
4
3
2
1
0
Std. Dev = 1.67
Mean = 4.6
N = 24.00
Min-Max
25%-75%
Median v a lue
Box & Whis k er Plo t: LEEFTIJ D
GESLACHT
LE
EF
TIJ
D
18
24
30
36
42
48
0 1
4
3
2
1
FIGUREN EN TABELLEN
Voor figuren en tabellen is het best om de Handleiding Statistica te gebruiken.
In kort:
- voor eenvoudige figuren: Graphs/2D/figuur kiezen
- voor complexere figuren: Graphs/Categorized/figuur kiezen
- voor frequentietabellen: Statistics/Basic Statistics/Frequencytabels
OEFENING 5
MAAK EEN FREQUENTIETABEL VOOR DE VARIABELEN SEX EN EDU EN EEN TAARTDIAGRAM VOOR EDU PER GESLACHT
BETROUWBAARHEIDSINTERVAL
= Interval dat met een bepaalde waarschijnlijkheid de parameter m bevat
Betrouwbaarheidsinterval (95%):
Waar standaarddeviatie kan berekend worden met: ( )
( )
x x
n
2
1
n
stdevs
sxsx
96,1;96,1
OEFENING 8
In een grootstad wordt een screeningsprogramma naar borstkanker uitgevoerd. Alle vrouwen tussen 40 en 69 jaar worden aangeschreven met de vraag zich te laten onderzoeken. 20 radiologen verlenen hun medewerking aan een ‘dubbele lezing’ van het mammogram. Van de 24 kankers die zij het afgelopen halfjaar ontdekten is de gemiddelde diameter 17 mm met een standaardafwijking van 5.2 mm. De overige radiologen uit de grootstad, die niet deelnamen aan de ‘dubbele lezing’, kwamen het afgelopen halfjaar 16 borstkankers op het spoor bij routine-onderzoeken. Hier bleek de gemiddelde diameter van het gezwel 20 mm met een standaardafwijking van 6.5 mm. Bereken de 95% betrouwbaarheidsinterval voor beide groepen.
OEFENING 9
Beschrijf de variabelen BLOOD PRESSURE LEVEL en SYSTOLIC BLOOD PRESSURE met behulp van kengetallen en figuren
OEFENING 10
Beschrijf de variabelen TOBACCO INTAKE LEVEL en CHOLESTEROL LEVEL met behulp van een frequentietabel