PPT Oefenzitting1 Oef-3

25
INITIATI E TOT HET MEDI SCH WETENSCHAPPELIJK O NDERZOEK OEF ENZI TTING 1

Transcript of PPT Oefenzitting1 Oef-3

INHOUD

Variabelen

Nominaal, ordinaal, numeriek/continu

Kengetallen:

Minimum, maximum, range

Gemiddelde (mean), mediaan, modus

Variantie, standaarddeviatie

Figuren en tabellen

Betrouwbaarheidsinterval

VARIABELEN

Nominaal (categorisch):

- waarden kennen geen rangorde- er is geen meeteenheid- er is geen nulpunt

Ordinaal:

- er is wel een rangorde- er is geen meeteenheid- er is geen nulpunt

Numeriek/continu:

- er is wel een rangorde- er is wel meeteenheid- er is geen (INTERVAL(SCHAAL))/ wel (RATIO/verhoudingschaal) nulpunt: Statistica 11 kent geen verschil!

kwalitatief niveau

kwantitatief niveau

kwalitatief niveau

OEFENING 1

GEEF VOORBEELDEN!

Categorische/nominale variabelen: ???

Ordinale variabelen: ???

Numerieke variabelen: ???

Interval: ???

Ratio: ???

OEFENING 2

BEPAAL HET TYPE VAN DE VOLGENDE VARIABELEN

• de bloedgroep van een mens (O, A, B en AB)

• het hoogste diploma van een persoon

• het aantal verkeersongevallen per jaar op een bepaald kruispunt

• de uitslag van een loopwedstrijd (in volgorde? In tijd?)

• indeling van wielrenners in wel of niet dopinggebruiker

• slagen van een operatie

TYPE GEGEVENS IS BELANGRIJK OMDAT...Met statistische softwares kan men ook

zinloze resultaten bekomen...

CAPTOPRIL DATASET

ID SEX EDU DIA_CHANGE SYS_VOOR DIA_VOOR SYS_NA DIA_NA1 1 1 5 210 130 201 1252 2 2 1 169 122 165 1213 2 2 3 187 124 166 1214 1 3 -2 160 104 157 1065 1 1 11 167 112 147 1016 1 2 16 176 101 145 857 2 1 23 185 121 168 988 1 1 19 206 124 180 1059 2 2 12 173 115 147 103

10 1 2 4 146 102 136 9811 1 3 8 174 98 151 9012 2 2 21 201 119 168 9813 2 3 -4 198 106 179 11014 1 1 4 148 107 129 10315 1 3 18 154 100 131 82

TER HERINNERING

Modus: de meest voorkomende waarde

Mediaan: de middelste van alle waarnemingen (moeten geordend zijn van klein naar groot)

Gemiddelde (mean): de som van alle uitkomsten gedeeld door het aantal waarnemingen

OEFENING 3

BEREKEN HET GEMIDDELDE, DE MODUS EN DE MEDIAAN VOOR ALLE VARIABELEN WAAR HET ZIN HEEFT ZONDER STATISTICA

(tip: Er is een rekenmachine/MS Excel in Windows)

GEMIDDELDE, MEDIAAN EN MODUS MET STATISTICA 11

Werkwijze:

0. Open Statistica 11, de dataset,...

1. Statistics, Basic Statistics/Tables, Descriptive Statistics.

2. Ga naar het tabblad “Advanced”.

3. Selecteer de variabele voor analyse

(e.g. DIA_CHANGE).

4. Selecteer mean, median, modus

GEMIDDELDE, MEDIAAN EN MODUS MET STATISTICA 11

STANDAARDDEVIATIE

Variantie en standaarddeviatie (standaardafwijking)

OEFENING 4: BEREKEN DE VARIANTIE EN DE STANDAARDDEVIATIE VAN DIA_CHANGE, DIA_VOOR, DIA_NA, SYS_VOOR, SYS_NA EERST ZONDER EN DAN MET STATISTICA

( )

( )

x x

n

2

1

( )

( )

x x

n

2

1

ANDERE KENGETALLEN

Range: maximum – minimum

Kwantielen:

Q1: 25% links en 75% rechts van Q1

Q2 = mediaan

Q3: 75% links en 25% rechts van Q1

Interkwartielafstand: Q3 – Q1

Percentielen, ...

FIGUREN EN TABELLEN

• Frequentietabel

• Staafdiagram

• Histogram

• Taartdiagram

• Box/whiskerplot

• ...

UITKOMST

3 12.5 12.5 12.5

4 16.7 16.7 29.2

4 16.7 16.7 45.8

6 25.0 25.0 70.8

4 16.7 16.7 87.5

2 8.3 8.3 95.8

1 4.2 4.2 100.0

24 100.0 100.0

2

3

4

5

6

7

8

Total

ValidFrequency Percent

ValidPercent

CumulativePercent

UITKOMST

8765432

Co

un

t

7

6

5

4

3

2

1

0

UITKOMST

8.07.06.05.04.03.02.0

7

6

5

4

3

2

1

0

Std. Dev = 1.67

Mean = 4.6

N = 24.00

Min-Max

25%-75%

Median v a lue

Box & Whis k er Plo t: LEEFTIJ D

GESLACHT

LE

EF

TIJ

D

18

24

30

36

42

48

0 1

4

3

2

1

FIGUREN EN TABELLEN

Voor figuren en tabellen is het best om de Handleiding Statistica te gebruiken.

In kort:

- voor eenvoudige figuren: Graphs/2D/figuur kiezen

- voor complexere figuren: Graphs/Categorized/figuur kiezen

- voor frequentietabellen: Statistics/Basic Statistics/Frequencytabels

OEFENING 5

MAAK EEN FREQUENTIETABEL VOOR DE VARIABELEN SEX EN EDU EN EEN TAARTDIAGRAM VOOR EDU PER GESLACHT

BETROUWBAARHEIDSINTERVAL

= Interval dat met een bepaalde waarschijnlijkheid de parameter m bevat

Betrouwbaarheidsinterval (95%):

Waar standaarddeviatie kan berekend worden met: ( )

( )

x x

n

2

1

n

stdevs

sxsx

96,1;96,1

OEFENING 6

VERBIND HET BETROUWBAARHEIDSINTERVAL MET HET JUISTE BETROUWBAARHEIDSNIVEAU:

OEFENING 7

WAT KAN HET VERSCHIL ZIJN TUSSEN DE TWEE GROEPEN VAN OBSERVATIES?

OEFENING 8

In een grootstad wordt een screeningsprogramma naar borstkanker uitgevoerd. Alle vrouwen tussen 40 en 69 jaar worden aangeschreven met de vraag zich te laten onderzoeken. 20 radiologen verlenen hun medewerking aan een ‘dubbele lezing’ van het mammogram. Van de 24 kankers die zij het afgelopen halfjaar ontdekten is de gemiddelde diameter 17 mm met een standaardafwijking van 5.2 mm. De overige radiologen uit de grootstad, die niet deelnamen aan de ‘dubbele lezing’, kwamen het afgelopen halfjaar 16 borstkankers op het spoor bij routine-onderzoeken. Hier bleek de gemiddelde diameter van het gezwel 20 mm met een standaardafwijking van 6.5 mm. Bereken de 95% betrouwbaarheidsinterval voor beide groepen.

NOG MEER O

EFENIN

GEN

DA

T AS

ET

HE

AR

TD

I SE

AS

E. S

T A

OEFENING 9

Beschrijf de variabelen BLOOD PRESSURE LEVEL en SYSTOLIC BLOOD PRESSURE met behulp van kengetallen en figuren

OEFENING 10

Beschrijf de variabelen TOBACCO INTAKE LEVEL en CHOLESTEROL LEVEL met behulp van een frequentietabel

OEFENING 11

Vergelijk patienten met/zonder hartaandoening (Coronary Heart Disease present/absent) voor de variabelen

• STRESS LEVEL TYPE A• OBESITY LEVEL• ALCOHOL CONSUMPTION• TOBACCO INTAKE (KG)• SYSTOLIC BLOOD PRESSURE

GEBRUIK FIGUREN, FREQUENTIETABELLEN EN KENGETALLEN!