Multivariate Analysemethoden und Multivariates...

30
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz 11.05.2009

Transcript of Multivariate Analysemethoden und Multivariates...

Page 1: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Multivariate Analysemethodenund

Multivariates Testen

Günter MeinhardtJohannes Gutenberg Universität Mainz

11.05.2009

Page 2: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Einführung

Verfahren

Multivariate Analysemethoden & Multivariates Testen

Prinzipien des inferenzstatistischen Schliessens

• Konfidenzintervalle• multivariate Mittelwertsvergleiche

• Hotelling‘s T2

• mulivariate Varianzanalyse (MANOVA)

Versuchspläne

Ziele • Wissen über statistische Verfahren• Wissen über Untersuchungsstrategien• Umsetzung mit Software

Typische Designs (Exp/Kontroll) nur Huasaufgabe

Page 3: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Literatura) b)

c) d)

Multivariate Analysemethoden & Multivariates Testen

Johnson/Wichern Backhaus

Bortz Winer

Page 4: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Problem

Frage

Anzahl der gefundenen Zielelemente in einem Konzentrationsleistungstest

(metrisch)Gruppierungsvariable Messgröße

Geschlecht

M J

Univariate Mittelwertevergleiche - Problemstellung

x

Unterscheidet sich die Leistung von Mädchen und Jungenim statistischen Mittelwert ?

Beispiel

Page 5: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Stichprobe

Frage

Wir untersuchen 40 Mädchen und 45 Jungen

Univariate Mittelwertevergleiche - Problemstellung

Gibt es wirkliche Leistungsunterschiede zwischen Jungen und Mädchen, oder ist der gefundene Unterschied „rein zufällig“ ?

Beispieldaten

23.7 17.2

Geschlecht

M J

Mx Jx M Jx x x− = Δ

23.7 – 17.2 = 6.5

Page 6: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Strategie

Urteil

Ermittle die Wahrscheinlichkeit für den beobachtetenMittelwertsunterschied unter der Annahme, dass beide Gruppen in der Population denselben Mittelwert besitzen 

Univariate Mittelwertevergleiche - Prüfstrategie

Ist der beobachtete Mittelwertsunterschied unter der H0 sehr unwahrscheinlich (höchstens 5%), so lehnen wir die H0 ab, und sehen die H1 als die bessere Alternative an. 

Annahme

0 : J MH μ μ=

Die Populationsmittelwerte von Jungen und Mädchen sind gleich

Null-Hypothese

Alternativ-Hypothese 1 : J MH μ μ≠

Page 7: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Theoretische Verteilung – Sampling Distribution

Sampling Population der Jungen

Stichprobe des Umfangs NJ

Jx

Population der Mädchen

Stichprobe des Umfangs NM

Mx

Mittelwertsdifferenz

M Jx x xΔ = −

1 1 1M Jx x xΔ = −

2 2 2M Jx x xΔ = −Tue dies k - mal:

k Mk Jkx x xΔ = −

( )1 2 i kx x x xΔ Δ Δ Δ… …Verteilung derDifferenzen von Mittelwerten

Page 8: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Central LimitTheorem

Die Verteilung von Differenzen von Mittelwerten nähert sich mit wachsendem Umfang der Sample‐Stichproben einer Normalverteilung. Für N > 30 ist die Approximation gut.

σ0.00

0.05

0.10

Wah

rsch

einl

ichk

eits

dich

te

( )f xΔ

0 2σ

xσ Δ

Es gilt:

Theoretische Verteilung – Sampling Distribution

xΔxΔ−σ xΔ−2σ xΔ

xσ Δ

0xμΔ =

(wird geschätzt)

In der theoretischen Verteilung der Differenzen von Mittel‐werten wird die Wahrscheinlichkeitsbestimmung vorge‐nommen. Sie liegt dem inferenzstatistischen Schluss zugrunde. 

Inferenzstat.Schluss

Page 9: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Sampling Distribution – Bestimmung des Standardfehlers

Unabhängigkeit Ist die Messvariable eine in beiden Populationen unabhängige ZV:

2 2M J

xM JN N

σ σσ Δ = +

Jungen und Mädchen kommen aus derselben Population2 2 2M Jσ σ σ= =

Gleichheit derPopulations-varianz

2 1 1x

M JN Nσ σΔ

⎛ ⎞= +⎜ ⎟

⎝ ⎠Standardfehler

Page 10: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Sampling Distribution – Schätzung des Standardfehlers

Für die Populationsvarianz verwendet man eine Schätzung aus den Daten beider Stichproben:

2 22ˆ

2M M J J M J

M J M J

N s N s SAQ SAQN N df df

σ ⋅ + ⋅ += =

+ − +

wobei     und      die Stichprobenvarianzen sind2Ms 2

Js

2 2 1 1ˆ2

M M J Jx

M J M J

N s N sN N N N

σ Δ

⋅ + ⋅= ⋅ +

+ −

Dann gilt

Schätzung ausStichproben

“Pooling”

(Beste Schätzung des Standardfehlers aus Stichprobendaten)

Schätzformel

Page 11: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Normalverteilung – z –Standardnormalverteilung

20 30 40 50 60 70 800.00

0.05

0.10

Wah

rsch

einl

ichk

eits

dich

te

x xzs−

=

Wah

rsch

einl

ichk

eits

dich

te

-3 -2 -1 0 1 2 30.00

0.05

0.10

f (z)

1zσ =

zx

Normalverteilung Standard‐Normalverteilung

Die z‐ Transformation übersetzt die Rohdatenskala in die Standardskala( z = 0, σz = 1)_

x_

z_

f (x)

Page 12: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Sampling Distribution – Prüfgrösse

z- Skala derDifferenzen von Mittelwerten

x

x

xz μσ

Δ

Δ

Δ −=

Unter der H0 gilt 0xμΔ =

Dann gilt:Prüfgrössex

xzσ Δ

Δ= ist standardnormalverteilt

[ ] z0 1 22− 1−

0 xσ Δxσ Δ− 2 xσ Δ2 xσ Δ−[ ] xΔTransformation

Page 13: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Entscheidung über Prüfgrösse mit Standardnormalverteilung

( )f t

-4 -2 2 4

0.1

0.2

t0

2.5%2.5%

95%x

xzσ Δ

Δ=

Prüfgrösse

Testen zum Signifikanzniveau α: Ist |z| > z1-α/2?

0.05α =Signifikanzniveau

( )1 /2P z z α α−> =

1 /2z α−1 /2z α−−Annahmebereich

1 /2z z α−≤Ablehnungsbereich

1 /2z z α−>Ablehnungsbereich

1 /2z z α−<

Page 14: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Entscheidung über Signifikanz des Mittelwerteunterschieds

1. Prüfgrösse Berechnex

xzσ Δ

Δ=

A. Gilt |z| > z1-α/2 Ablehnung von H03. Entscheide

(die Mittelwerte der J. und M. sind signifikant verschieden)

Ermittle kritischen z ‐Wert z1-α/2 für ein α− Fehlerniveau2. Kritischerz - Wert

(die Mittelwerte der J. und M. unterscheiden sich zufällig)

B. Gilt |z| < z1-α/2 Beibehalten von H0_

Page 15: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Numerisches Beispiel

Differenz derMittelwerte

23.7 17.2

173 106

Mx Jx M Jx x x− = Δ

23.7 – 17.2 = 6.52Ms 2

Js

40 173 45 106 1 1ˆ 2.5840 45 2 40 45xσ Δ

⋅ + ⋅= ⋅ + =

+ −Standardfehler

Prüfgrösse undKritischer Wert

6.5 2.522.58

z = = z1-α/2 = z0.975 = 1.96

Entscheidung d.h. |z| > z1-α/22.52 > 1.96 H0 ablehnen

Die Mittelwerte entstammen nicht derselben Population(unterscheiden sich signifikant)

Page 16: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Voraussetzungen der Prüfung

Varianz-homogenität

Unabhängigkeit

a. Die Populationsvarianzen die beiden Stichproben zuGrunde liegen, müssen gleich (homogen) sein. (Prüfung mit geignetem Verfahren)

b.  Die Messeinheiten innerhalb jeder Stichprobe müssenunabhängig sein.

c.  Die Messeinheiten beider Stichproben dürfen nicht teilweise paarweise zuzuordnen sein. 

Verletzungen Der Test ist relativ robust gegen Verletzungen der Varianzhomogenität. Verletzungen der Unabhängigkeit(b.) führen zur Ungültigkeit der Prüfgrösse, der Unab‐hängigkeit (c.) je nach Höhe der Korrelationen zu progressiven (kleine Korr.) oder zu konservativen Entscheidungen (hohe Korr.).

Page 17: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Mittelwertsprüfung bei mehreren Variablen

Beispiel

X1: GehaltX2: EntscheidungsfreiheitX3: Qualität der Kommunikation

Person

ArbeitX4: EheX5: Freunde/BeziehungenX6: Sexualität

Privatsphäre

X7: LebensansprücheX8: Sinnhaftigkeit

X9:  HobbiesX10: Sport/Fitness

Aktivität

( )1 2 10, , ,x x x…

Lebenszufriedenheit

Gesunde Herzinfarktpatienten

10 Variablen

2 Gruppen

Page 18: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Multivariate Mittelwertsvergleiche - Einzeltestungen

Teststrategie

Frage

Ausweg

Unterscheiden sich Gesunde und Patienten im Variablen‐komplex Lebenszufriedenheit?

Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t‐ Test. Wenn irgend einer der Tests signifikantwird, sehen wir die Gruppen als verschieden an.

Probleme 1. Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft.2. Unterstellte Unabhängigkeit:Man behandelt die einzelnen 

Skalen als unabhängig voneinander.3. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht als

Variablenkomplex mit Binnenstruktur behandelt.4. Mangelnde Teststärke:Man nutzt nicht die Korrelations‐

struktur der Variablen für einen leistungsfähigen Test.

Verwendung einesmultivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in einestatistische Prüfgrösse einfliessen lässt.

Page 19: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Einzeltestungen - Bonferronikorrektur

α − FehlerKumulierung

Overall α

Bei simultanen Einzeltestungen „kumuliert“ sich das α – Risiko:

BonferroniApproximation

( )1/ˆ1 1ˆ

m

m

α αα

= − −

Setzt man das overall -Niveau fest und löst nach auf, folgt α̂

( ) ( )( )

( )( ) ( )( )

1 2

ˆ mind. 1 falsch 1 keinen 1 falsch

1

1 1 1 1

1 1

m

m

P P

P T T T

α

α α α

α

= = −

= − ∩ ∩ ∩

= − − − −

= − −

Um alle m Tests auf einem konventionellen Alpha Niveau abzusichern, muss dieses durch die Anzahl der Tests geteilt werden. Bei 10 Tests muss man für ein overall Alpha = 5% ein Test‐Alpha von 0.5% verwenden.  

Page 20: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Multivariate Mittelwertsvergleiche - Verfahren

MultivariatesTestkonstrukt

Variablen-komplex

Verfahren

( )1 2 10, , ,x x x…

Multivariate Distanz(Mahalanobisdistanz)

Multivariate Quadratsummen(SSCP-Matrizen-Zerlegung)

Optimale Linearkombination(Linear Discriminant Function)

Hotelling‘s T2 MANOVA Diskriminanz-Analyse

Alle Verfahren entscheiden über den Gruppenunterschied imgesamten Variablenkomplexmit  einem statistischen Test

Page 21: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Grundprinzip(2 Gruppen)

Multivariates Testen - Diskriminanzanalyse

( )1 2, , , mx x x…finde eine Linearkombination zu einer neuen Variable

Für die m Variablen

0 1 1 2 2 m my b b x b x b x= + + + +…so dass diese die Gruppen c1 und c2 optimal trennt.

Das Optimierungskriterium für die Wahl der bj lautet

erklärte Variation maxnicht erklärte Variation

Between

Within

QSQS

= =

Die der bj sind so zu wählen, dass auf der neuen Variable y die Streuung zwischen den Gruppen zu der Streuung innerhalb der Gruppen ein maximales Verhältnis hat.

Kriterium derOptimierung

Page 22: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

2D-Beispiel Man möchte trennen

anhand von

Anforderung

2D Beispiel Diskriminanzanalyse

Stechmückenc1

Blindmückenc2

Fühlerlängex1

2 Variablen Flügellängex2

• Maximale Gruppentrennung (Mittelwerte)• Minimale Klassifikationsfehler (Fall‐Klassifikation)

2 Gruppen

Page 23: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1.40

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70

(Fühlerlänge)

Blindmücke

Stechmücke

Variablenraum

• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2)möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).

• In beiden Gruppen existiert eine Korrelation der Variablen Fühlerlänge (X1) und Flügellänge (X2).

Ausgangslage

x1

(Flügelänge)x2

2D Beispiel Diskriminanzanalyse

Regression Stechmücke

Regression Blindmücke

Page 24: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Bestes Kriterium auf x1

Blindmücke

Stechmücke

• Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2)möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2).

• Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1und X2 offenbar nicht. 

Problem

2D Beispiel Diskriminanzanalyse

x1

x2

Bestes Kriterium auf x2

Variablenraum

Page 25: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

0.00

0.20

0.40

0.60

0.80

1.00

1.20

1.40

0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70

(Fühlerlänge)

Blindmücke

Stechmücke

x1

(Flügelänge)x2

Variablenraum

2D Beispiel Diskriminanzanalyse

Kriteriumsfunktion

Lösung Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2 Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2).

2 1x b ax= +Somit folgt die Klassifikationsfunktion

( ) 1 2 11 2

2 2 1

, wenn ,

, wenn c x ax b

g x xc x ax b

− >⎧= ⎨ − ≤⎩

Page 26: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

EinfacheLösung

2D Beispiel Diskriminanzanalyse

Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen Winkel α drehen !

x1

1x′

2x′x2

α

α

Zentrierung&

Rotation !

Die Varianz zwischen den Gruppen wird auf der Achse x‘1maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert das optimale Trennkriterium.

Page 27: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

z-Standard

2D Beispiel Diskriminanzanalyse

standardisiert

-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00

-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00

z1

z2

Page 28: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

z-Standard

2D Beispiel Diskriminanzanalyse

Diskriminanz-funktion

• Die neue x‐ Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßtsich ein Kriterium zur optimalen Trennung beider Gruppen finden. 

1 1 1 2 2z b z b z′ = +

• Da eine Drehoperation auf die Diskriminanzfunktion geführt hat, ist sie darstellbar als eine Linearkombination der alten Koordinaten:

-3.00

-2.00

-1.00

0.00

1.00

2.00

3.00

-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00

z‘1

z‘2

Koordinaten rotiert um α = 46° (clockwise)

Page 29: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

y: Linear-kombination

2D Beispiel Diskriminanzanalyse

Koeffizientenvon y

Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem Problem, den optimalen Drehwinkel α zu bestimmen. Hierfür braucht man ein Kriterium der gewünschten maximalen Trennung, und die Lösung des dahinter stehenden Maximierungsproblems.

y (Diskriminanzfunktion)

Kriterium y0

blindstech

1 1

2 2

cos sinsin cos

z zz z

α αα α

′− ⎛ ⎞ ⎛ ⎞⎛ ⎞=⎜ ⎟ ⎜ ⎟⎜ ⎟ ′⎝ ⎠⎝ ⎠ ⎝ ⎠

1 2 1

1 2 2

cos sinsin cos

z z zz z z

α αα α

′− =′+ =

Da 1y z′= gilt

1 1 2 2y b z b z= +

mit 1 cosb α= und 2 sinb α= −

[Excel-Beispiel]

Page 30: Multivariate Analysemethoden und Multivariates Testenmethodenlehre.sowi.uni-mainz.de/download/Lehre/SS2009/Multivariate... · Verfahren Multivariate Analysemethoden & Multivariates

Methoden derPsychologie

Rotation zury - Funktion

2D Beispiel Diskriminanzanalyse

y (Diskriminanzfunktion)

z1

z2

Klassifikation • Case‐Classification durch einfachen Vergleich mit dem Kriterium y0. 

• Prüfung des Gruppenunterschieds mit einem einfachen t ‐ Test auf y.

y (Diskriminanzfunktion)

Kriterium y0

blind

stech