Program – dag 2 (11. april 2011) - Universitetet i Bergen
Transcript of Program – dag 2 (11. april 2011) - Universitetet i Bergen
Program – dag 2 (11. april 2011)
Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge; 6) Videre perspektiver.
Hvordan kan man behandle data?
Tre niveauer
Beskrivende statistik – alene tallene selv
Analytisk statistik – antagelse om bagvedliggende idealfigur (fordeling)
Modeller – komplekse computerberegninger som bruges til at forudsige sammenhænge
Jo højere målniveau (=tal)Jo flere muligheder for statistisk bearbejdning
Fra forberedelsen: Antagelser om sammenhænge
Hvis ingen antagelser om sammenhænge mellem 2 spørgsmål, bliver det uoverskueligt!
Hvis vi for eksemplets skyld antager, at hvert spørgsmål har bare 2 svarmuligheder, så kan
2 spørgsmål kan kombineres på 1 måde3 spørgsmål kan kombineres på 6 måder4 spørgsmål kan kombineres på 12 måder5 spørgsmål kan kombineres på 20 måder
n spørgsmål kan kombineres på n!
(n-r)!måder
n! betyder, at man ganger et tal, n, med talrækken op til n:Eksempel: hvis n = 7 betyder n! 7*6*5*4*3*2*1
r er antallet af spørgsmål, der skal indgå i kombinationen
SPSS – hvad er det?
SPSS (originally, Statistical Package for the Social Sciences)
PASW Statistics 17.0.3 - September 2009
IBM SPSS Statistics 19.0 - August 2010
Alternativer – ’R’
SPSS – hvad skal man gøre?Indledende øvelser 1/2
1. Hente data – downloade fra elektronisk spørgeskema, importere fra Excel, indtaste direkte
2. Rådata kan sjældent bare bruges – de skal først tjekkes for fejl
Kategoriske variable- Udskriv frekvenser (Analyze descriptive Statistics frequences)- Vælg en variabel, vælg ’statistics’, sæt hak ved ’min’ og ’max’
- Er antallet sandsynligt? Er der mange ’missing values’ og hvorfor?
Kontinuerte variable- Udskriv frekvenser (Analyze descriptive Statistics frequences)- Sæk hak ved forskellige ’statistics’
- Er resultaterne sandsynlige? Fordeler besvarelserne sig fornugtigt
SPSS – hvad skal man gøre?Indledende øvelser 2/2
Hvilket årstal er du født? Svar 1962 eller svar 62
Hvilke 3 ting betyder mest for dig? Svar 2 eller 5 ting
Spørgsmål: Dyrker du motion. Svar ’nej’. Andet spørgsmål: Hvad er dit erhverv? Svar ’flyttemand’
Hvert spørgsmål skal tjekkes: Er svarfordelingen sandsynlig? Er der ’underlige svar’?
3. Undersøg for deciderede fejl:
- Vælg Analyze Descriptive statistics Explore
SPSS – Indledende analyser
Fx undersøg fordeling:
-Er kurven til højre over respondenternes fødselsår normaltfordelt?
Hvad hvis man deler gruppen op i mænd og kvinder – er den så (stadig) normalfordlet?
- Samme data kan vises på flere måder
Her udgør hver gruppe 100%
Her udgør hver kategori 100%
Her udgør søjlerne tilsammen 100%
Ændring af data
Man kan omkode data:
Alder aldersintervaller: Respondenter født mellem 1960 – 1970 I 40’erne
Kategorier færre kategorier: Meget enig og noget enig enig
Lægge variable sammen til nye variable: Respondenter, der angiver ’ja til EU’ og ’kvinder’ ’EU-positive kvinder’
Brug Transpose Recode into new variable
At analysere relationer mellem variable
Variabeltype Måder at vise relationer mellem variablene
Metode at analysere relationen med
Nominal – nominal •Kontingenstabel•Grupperede søjlediagrammer
•Procentvis sammenligning ml. en af variablene
Nominal – ordinal •Kontingenstabel•Grupperede søjlediagrammer (evt. akkumuleret)
•Procentvis sammenligning ml. den nominelle variable
Nominal – skala •Boxplot •Sammenligning af middel eller median
Ordinal - ordinal •Kontingenstabel•Grupperede søjlediagrammer
•Spearman korrelation
Ordinal - skala •Boxplot •Spearman korrelation
Skala - skala •Scatterplot •Hvis lineær: Pearson, hvis ikke-lineær: Spearman
At undersøge sammenhængen mellem holdning til forældres ansvar og køn
83. Hvilket af disse to udsagn beskriver bedst Deres mening om forældres ansvar/pligter over for deres børn?
1. Det er forældrenes pligt at gøre alt, hvad der står ideres magt for deres børn, uanset om det skulle gåud over deres egen trivsel ............................................. 12. Forældre har også deres eget liv, og man kan ikkeforlange, at de skal ofre deres egen trivsel forbørnenes skyld ................................................................ 23. Ingen af delene ............................................................... 3
Svaret på spørgsmålet fordeler sig således
Kan vi på baggrund af ovenstående konkludere, at kvinder går meget mere ind for, at ”Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel ” end mænd?
Opstille en hypotese
Man tester altid konservativt – altså H(nul): Der er ikke forskel på kvinder og mænd.
Falder hypotesen bliver alternativet H(alt) tilfældet: Der er forskel på kvinder og mænd
Vælg DescriptiveCrosstabVariable
Vælg ’Statistics’ sæt hak i Chi-square og Phi and Cramers V
1. Her skal rapporteres ’ingen fejl’.Dvs ingen celler må have expected < 5.Dette er en forudsætning for at kunnebruge chi-testen
2. Dette tal skal rapporteres sammen med tabellen.Det, der står er, at der er en chance på 7,6% for at forskellen,vist i tabellen, skyldes tilfældighed
3. Tabeller på 2*2 Phi, større V
Samlet konklusion: Undersøgelsen viste ikke statistisk signifikant forskel på mænd og kvinder med hensyn til opfattelse af forældres ansvar. (p=0,076, Chi-square=5,166, df=2)
Konvention: p > 5%, dvs p > 0,05 kan vi ikke forkaste H(nul)