Program – dag 2 (11. april 2011) - Universitetet i Bergen

19
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge; 6) Videre perspektiver.

Transcript of Program – dag 2 (11. april 2011) - Universitetet i Bergen

Program – dag 2 (11. april 2011)

Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge; 6) Videre perspektiver.

Hvordan kan man behandle data?

Tre niveauer

Beskrivende statistik – alene tallene selv

Analytisk statistik – antagelse om bagvedliggende idealfigur (fordeling)

Modeller – komplekse computerberegninger som bruges til at forudsige sammenhænge

Jo højere målniveau (=tal)Jo flere muligheder for statistisk bearbejdning

Fra forberedelsen: Antagelser om sammenhænge

Hvis ingen antagelser om sammenhænge mellem 2 spørgsmål, bliver det uoverskueligt!

Hvis vi for eksemplets skyld antager, at hvert spørgsmål har bare 2 svarmuligheder, så kan

2 spørgsmål kan kombineres på 1 måde3 spørgsmål kan kombineres på 6 måder4 spørgsmål kan kombineres på 12 måder5 spørgsmål kan kombineres på 20 måder

n spørgsmål kan kombineres på n!

(n-r)!måder

n! betyder, at man ganger et tal, n, med talrækken op til n:Eksempel: hvis n = 7 betyder n! 7*6*5*4*3*2*1

r er antallet af spørgsmål, der skal indgå i kombinationen

SPSS – hvad er det?

SPSS (originally, Statistical Package for the Social Sciences)

PASW Statistics 17.0.3 - September 2009

IBM SPSS Statistics 19.0 - August 2010

Alternativer – ’R’

SPSS – hvordan ser det ud?

SPSS – 3 vinduer:Data – Output - Log

SPSS – hvad skal man gøre?Indledende øvelser 1/2

1. Hente data – downloade fra elektronisk spørgeskema, importere fra Excel, indtaste direkte

2. Rådata kan sjældent bare bruges – de skal først tjekkes for fejl

Kategoriske variable- Udskriv frekvenser (Analyze descriptive Statistics frequences)- Vælg en variabel, vælg ’statistics’, sæt hak ved ’min’ og ’max’

- Er antallet sandsynligt? Er der mange ’missing values’ og hvorfor?

Kontinuerte variable- Udskriv frekvenser (Analyze descriptive Statistics frequences)- Sæk hak ved forskellige ’statistics’

- Er resultaterne sandsynlige? Fordeler besvarelserne sig fornugtigt

SPSS – hvad skal man gøre?Indledende øvelser 2/2

Hvilket årstal er du født? Svar 1962 eller svar 62

Hvilke 3 ting betyder mest for dig? Svar 2 eller 5 ting

Spørgsmål: Dyrker du motion. Svar ’nej’. Andet spørgsmål: Hvad er dit erhverv? Svar ’flyttemand’

Hvert spørgsmål skal tjekkes: Er svarfordelingen sandsynlig? Er der ’underlige svar’?

3. Undersøg for deciderede fejl:

- Vælg Analyze Descriptive statistics Explore

SPSS – Indledende analyser

Fx undersøg fordeling:

-Er kurven til højre over respondenternes fødselsår normaltfordelt?

Hvad hvis man deler gruppen op i mænd og kvinder – er den så (stadig) normalfordlet?

SPSS – beskrivelse af data vhagrafer

Brug Graphs chart builder

Træk graftype og variable på plads

- Samme data kan vises på flere måder

Her udgør hver gruppe 100%

Her udgør hver kategori 100%

Her udgør søjlerne tilsammen 100%

Boxplot

Variabelen skal være kontinuert, men kan grupperes i forhold til kategorier

Ændring af data

Man kan omkode data:

Alder aldersintervaller: Respondenter født mellem 1960 – 1970 I 40’erne

Kategorier færre kategorier: Meget enig og noget enig enig

Lægge variable sammen til nye variable: Respondenter, der angiver ’ja til EU’ og ’kvinder’ ’EU-positive kvinder’

Brug Transpose Recode into new variable

Hvad kan man læse af tabeller?

At analysere relationer mellem variable

Variabeltype Måder at vise relationer mellem variablene

Metode at analysere relationen med

Nominal – nominal •Kontingenstabel•Grupperede søjlediagrammer

•Procentvis sammenligning ml. en af variablene

Nominal – ordinal •Kontingenstabel•Grupperede søjlediagrammer (evt. akkumuleret)

•Procentvis sammenligning ml. den nominelle variable

Nominal – skala •Boxplot •Sammenligning af middel eller median

Ordinal - ordinal •Kontingenstabel•Grupperede søjlediagrammer

•Spearman korrelation

Ordinal - skala •Boxplot •Spearman korrelation

Skala - skala •Scatterplot •Hvis lineær: Pearson, hvis ikke-lineær: Spearman

At undersøge sammenhængen mellem holdning til forældres ansvar og køn

83. Hvilket af disse to udsagn beskriver bedst Deres mening om forældres ansvar/pligter over for deres børn?

1. Det er forældrenes pligt at gøre alt, hvad der står ideres magt for deres børn, uanset om det skulle gåud over deres egen trivsel ............................................. 12. Forældre har også deres eget liv, og man kan ikkeforlange, at de skal ofre deres egen trivsel forbørnenes skyld ................................................................ 23. Ingen af delene ............................................................... 3

Svaret på spørgsmålet fordeler sig således

Kan vi på baggrund af ovenstående konkludere, at kvinder går meget mere ind for, at ”Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel ” end mænd?

Opstille en hypotese

Man tester altid konservativt – altså H(nul): Der er ikke forskel på kvinder og mænd.

Falder hypotesen bliver alternativet H(alt) tilfældet: Der er forskel på kvinder og mænd

Vælg DescriptiveCrosstabVariable

Vælg ’Statistics’ sæt hak i Chi-square og Phi and Cramers V

1. Her skal rapporteres ’ingen fejl’.Dvs ingen celler må have expected < 5.Dette er en forudsætning for at kunnebruge chi-testen

2. Dette tal skal rapporteres sammen med tabellen.Det, der står er, at der er en chance på 7,6% for at forskellen,vist i tabellen, skyldes tilfældighed

3. Tabeller på 2*2 Phi, større V

Samlet konklusion: Undersøgelsen viste ikke statistisk signifikant forskel på mænd og kvinder med hensyn til opfattelse af forældres ansvar. (p=0,076, Chi-square=5,166, df=2)

Konvention: p > 5%, dvs p > 0,05 kan vi ikke forkaste H(nul)