Inleiding in de statistiek voor de gedragswetenschappen . Met ondersteuning van SPSS
description
Transcript of Inleiding in de statistiek voor de gedragswetenschappen . Met ondersteuning van SPSS
1
INLEIDING IN DE STATISTIEK VOOR DE
GEDRAGSWETENSCHAPPEN. MET ONDERSTEUNING VAN
SPSS
INLEIDING IN DE STATISTIEKHOOFDSTUK IV FREQUENTIEVERDELINGEN & SPSS DESCRIPTIVES
DOELSTELLINGEN HOOFDSTUK IV• De student verstaat een aantal begrippen, zoals
frequentieverdeling, enz…• De student kan een univariate en meerdimensionele tabel
van de resultaten opstellen; • De student kent de diverse vormen van grafische voorstelling
van gegevens;• De student weet hoe het schaalniveau een impact heeft op
de wijze van grafische voorstelling;• De student kan percentielen/decielen/kwartielen bepalen uit
een frequentietabel; • De student kan via SPSS een frequentietabel maken en een
eenvoudige grafische voorstelling van de gegevens.
4.1. FREQUENTIETABEL
• Datamatrix bevat de resultaten van het onderzoek; dit is onoverzichtelijk
• Een frequentieverdeling geeft een beter overzicht.
• Één dimensionale tabel versus meer dimensionale tabel.
4.1. DE FREQUENTIETABEL
• Één dimensionale tabel
4.1. DE FREQUENTIETABEL• Meer dimensionale tabel (zgn.
kruistabel)Geslacht * nieuwleeftijd Crosstabulation
Count
38 99 13779 177 256
117 276 393
manvrouw
Geslacht
Total
buster boomernieuwleeftijd
Total
Cfr. Hoofdstuk IX
4.1. DE FREQUENTIETABEL
• Eendimensionale tabelFrequentie is het aantal keren dat een bepaalde waarde voorkomt- absolute frequentie- relatieve frequentie (%)- absolute cumulatieve frequentie - cumulatieve proportie (%)(beide laatsten worden niet gebruikt bij nominale waarden)
4.1. DE FREQUENTIETABEL
Lft Freq Prop. Cum freq Cum prop.
8 25 33 25 33 9 30 39 55 7210 21 28 76 100
4.2. GRAFIEKEN
• Nominale waarden• Ordinale waarden• Interval/ratio niveau
A. NOMINALE WAARDEN: GEBRUIK EEN TAARTDIAGRAM
B. ORDINALE GEGEVENS
Diploma
15 3,7 3,7 3,767 16,7 16,7 20,4
150 37,3 37,3 57,7
127 31,6 31,6 89,3
43 10,7 10,7 100,0402 100,0 100,0
lager onderwijslager middelbaarhoger middelbaarhoger niet-universitaironderwijsuniversitair onderwijsTotal
ValidFrequency Percent Valid Percent
CumulativePercent
B. ORDINALE GEGEVENS: GEBRUIK EEN STAAFDIAGRAM
C. SCALE
DatamatrixTaalvaardigheid,Rekenvaardigheid,Leeftijd en Geslacht
SPSS biedt eenoverzicht van de resultaten, middels een
frequentietabel
Taalvaardigheid
1 ,5 ,5 ,51 ,5 ,5 1,11 ,5 ,5 1,64 2,1 2,2 3,85 2,7 2,7 6,51 ,5 ,5 7,07 3,7 3,8 10,88 4,3 4,3 15,1
13 6,9 7,0 22,010 5,3 5,4 27,4
9 4,8 4,8 32,316 8,5 8,6 40,919 10,1 10,2 51,115 8,0 8,1 59,116 8,5 8,6 67,7
7 3,7 3,8 71,510 5,3 5,4 76,9
9 4,8 4,8 81,712 6,4 6,5 88,210 5,3 5,4 93,5
6 3,2 3,2 96,84 2,1 2,2 98,92 1,1 1,1 100,0
186 98,9 100,02 1,1
188 100,0
6266687071727374757677787980818283848586878891Total
Valid
SystemMissingTotal
Frequency Percent Valid PercentCumulative
PercentScale niveau
GRAFISCHE VOORSTELLING: HISTOGRAM
GEGROEPEERDE FREQUENTIETABEL• Enkel om de gegevens overzichtelijk voor te
stellen; informatie gaat verloren
• Voor de komst van SPSS gebruikelijke wijze van voorstelling;Hoeveel klassen? Turven van aantallen, enz… verwijzen we naar het pre-SPSS tijdperk.
• Geen verdere analyse van de gegevens aan de hand van dergelijke tabel.
Histogram
05
1015202530354045
0 20 40 60 80
Snelheid in km/uur
Abs
olut
e Fr
eque
ntie
s
gecumuleerdeonder boven absolute relatieve absolute relatieve
Klasse grens grens centrum frequentie frequentie frequentie frequentie31-34 30,5 34,5 32,5 2 1,3% 2 1,3%35-38 34,5 38,5 36,5 7 4,5% 9 5,7%39-42 38,5 42,5 40,5 11 7,0% 20 12,7%43-46 42,5 46,5 44,5 39 24,8% 59 37,6%47-50 46,5 50,5 48,5 33 21,0% 92 58,6%51-54 50,5 54,5 52,5 32 20,4% 124 79,0%55-58 54,5 58,5 56,5 17 10,8% 141 89,8%59-62 58,5 62,5 60,5 11 7,0% 152 96,8%63-66 62,5 66,5 64,5 3 1,9% 155 98,7%67-70 66,5 70,5 68,5 2 1,3% 157 100,0%
TOTAAL 157 100,0%
Histogram
FREQUENTIETABEL EN HISTOGRAM MET SPSS
• SPSS zal voor een frequentietabel niet automatisch een gegroepeerde tabel maken. Dit is wel mogelijk via recode van de gegevens. Eventueel een stem-and-leaf plot.
• Als histogram zal SPSS bij een grote diversiteit van waarden automatisch de waarden in klassen indelen
SPSS AANMAKEN VAN TABEL
SPSS AANMAKEN VAN EEN TABEL
SPSS OUTPUT VAN EEN TABEL
Diploma
15 3,7 3,7 3,767 16,7 16,7 20,4
150 37,3 37,3 57,7
127 31,6 31,6 89,3
43 10,7 10,7 100,0402 100,0 100,0
lager onderwijslager middelbaarhoger middelbaarhoger niet-universitaironderwijsuniversitair onderwijsTotal
ValidFrequency Percent Valid Percent
CumulativePercent
AANMAKEN VAN EEN KRUISTABEL
DIALOOGVENSTER CROSSTABS
SPSS OUTPUT KRUISTABEL
geslacht * status Crosstabulation
Count
5 30 351 41 426 71 77
jongenmeisje
geslacht
Total
dyslexie geen dyslexiestatus
Total
SPSS AANMAKEN VAN EEN TAARTDIAGRAM
Analyze – Descriptives statistics - Frequencies
SPSS AANMAKEN VAN EEN TAARTDIAGRAM
SPSS OUTPUT TAARTDIAGRAM (PIE CHART)
SPSS AANMAKEN VAN EEN STAAFDIAGRAM
SPSS OUTPUT VAN EEN STAAFDIAGRAM(BAR CHART)
SPSS AANMAKEN VAN HISTOGRAM
SPSS OUTPUT VAN EEN HISTOGRAM
4.2.4. MAAK EEN STEM-AND-LEAF PLOT
SPSS MAAK EEN STEM-AND-LEAF PLOT
STEM-AND-LEAF PLOT
4.2.5.BOXPLOT MAKEN IN SPSS
SPSS KEUZE VAN BOXPLOT
BOXPLOT AANMAKEN
Boxplot gezondheidsbesef
SPSS WERKEN INTERACTIEVE GRAFIEK
• Hoe zou de verdeling zijn van de diploma’s bij dames en heren in deze steekproef?Gebruik de gegevens van busters.sav
4.2.6. GECLUSTERD STAAFDIAGRAM
GECLUSTERDSTAAFDIAGRAM
PASW GECLUSTERD STAAFDIAGRAM
lager onderwijslager middelbaarhoger middelbaarhoger niet-universitair onderwijsuniversitair onderwijs
Diploma
Bars show counts
man vrouw
Geslacht
0
25
50
75
SPSS geclusterd staafdiagram
4.2.7. SPSS GESTAPELD STAAFDIAGRAM
geslachtvrouwman
Coun
t400
300
200
100
0
universitair onderwijs
hoger niet-universitair onderwijs
hoger middelbaarlager middelbaarlager onderwijs
diplome
4.3. SELECT CASES
4.3. SELECTIE VAN CASES
4.4. POSITIE VAN EEN SCORE IN EEN VERDELING VAN UITSLAGEN
• Het percentiel P van een ruwe score is het percentage metingen dat kleiner is (of gelijk aan) dan deze ruwe score.
Dus hoeveel procent van de observaties ligt beneden deze score (of is gelijk aan)?
PERCENTIELSCORES
• Voorbeeld: op een taaltest behaalde Jan een score van 112/120. Is dat een goede score? Kijk hiervoor naar het percentiel. Als 20% van de leerlingen een betere score behaalde, zeggen we dat de uitslag 112 het 80ste percentiel is, ofwel P80=112Als 70% van de leerlingen een betere score behaalde, zeggen we dat deze uitslag het 30ste percentiel is, ofwel P30=112
Taalvaardigheid
1 ,5 ,5 ,51 ,5 ,5 1,11 ,5 ,5 1,64 2,1 2,2 3,85 2,7 2,7 6,51 ,5 ,5 7,07 3,7 3,8 10,88 4,3 4,3 15,1
13 6,9 7,0 22,010 5,3 5,4 27,4
9 4,8 4,8 32,316 8,5 8,6 40,919 10,1 10,2 51,115 8,0 8,1 59,116 8,5 8,6 67,7
7 3,7 3,8 71,510 5,3 5,4 76,9
9 4,8 4,8 81,712 6,4 6,5 88,210 5,3 5,4 93,5
6 3,2 3,2 96,84 2,1 2,2 98,92 1,1 1,1 100,0
186 98,9 100,02 1,1
188 100,0
6266687071727374757677787980818283848586878891Total
Valid
SystemMissingTotal
Frequency Percent Valid PercentCumulative
Percent
Percentiel
Cumulatief percent biedt inzicht in percentiel
PERCENTIEL
• Welk is het percentiel bij een bepaalde score? D.i. hoeveel procent van de observaties zijn lager (of gelijk aan) dan deze score?
• Welke score komt overeen met een bepaald percentiel? Beneden welke waarde situeren zich een bepaald percentage observaties?
Gebruik steeds de frequentietabelGEEN berekeningen uit een gegroepeerde tabel.
VOORBEELD PCLeeftijd
17 4,3 4,3 4,317 4,3 4,3 8,614 3,5 3,5 12,2
9 2,3 2,3 14,417 4,3 4,3 18,7
7 1,8 1,8 20,59 2,3 2,3 22,8
10 2,5 2,5 25,39 2,3 2,3 27,68 2,0 2,0 29,69 2,3 2,3 31,98 2,0 2,0 33,9
12 3,0 3,0 37,015 3,8 3,8 40,817 4,3 4,3 45,118 4,6 4,6 49,625 6,3 6,3 55,918 4,6 4,6 60,515 3,8 3,8 64,319 4,8 4,8 69,126 6,6 6,6 75,7
9 2,3 2,3 78,019 4,8 4,8 82,816 4,1 4,1 86,8
9 2,3 2,3 89,110 2,5 2,5 91,612 3,0 3,0 94,7
5 1,3 1,3 95,98 2,0 2,0 98,06 1,5 1,5 99,52 ,5 ,5 100,0
395 100,0 100,0
30313233343536373839404142434445464748495051525354555657585960Total
ValidFrequency Percent Valid Percent
CumulativePercent
Statistics
Leeftijd395
032,0037,0046,0050,00
ValidMissing
N
10255075
Percentiles
totgezond
1 ,2 ,2 ,21 ,2 ,2 ,51 ,2 ,2 ,71 ,2 ,2 1,05 1,2 1,2 2,22 ,5 ,5 2,76 1,5 1,5 4,25 1,2 1,2 5,54 1,0 1,0 6,51 ,2 ,2 6,78 2,0 2,0 8,76 1,5 1,5 10,2
19 4,7 4,7 14,91 ,2 ,2 15,2
15 3,7 3,7 18,921 5,2 5,2 24,117 4,2 4,2 28,428 7,0 7,0 35,325 6,2 6,2 41,518 4,5 4,5 46,0
2 ,5 ,5 46,536 9,0 9,0 55,528 7,0 7,0 62,428 7,0 7,0 69,4
1 ,2 ,2 69,725 6,2 6,2 75,926 6,5 6,5 82,321 5,2 5,2 87,617 4,2 4,2 91,812 3,0 3,0 94,811 2,7 2,7 97,57 1,7 1,7 99,33 ,7 ,7 100,0
402 100,0 100,0
1,501,832,672,833,003,173,333,503,673,803,834,004,174,204,334,504,674,835,005,175,205,335,505,675,805,836,006,176,336,506,676,837,00Total
ValidFrequency Percent Valid Percent
CumulativePercentStatistics
totgezond402
04,00004,66675,33335,8333
ValidMissing
N
10255075
Percentiles
VARIANTEN VAN DE PERCENTIELSCORE• Decielscore. We verdelen de uitslagen in
10 delen, zodanig dat in elk onderdeel 10% van de observaties zich situeren;dus D1 = Pc10, D2 = Pc20, enz…
• Kwartielscores. We verdelen de uitslagen in vier onderdelen, die elk 25% van de observaties bevatten.dus Q1 = Pc25; Q2 = Pc 50 en Q3 = Pc75
OPGAVEN UIT HET HANDBOEK
54
INLEIDING IN DE STATISTIEK VOOR DE
GEDRAGSWETENSCHAPPEN. MET ONDERSTEUNING VAN
SPSS