Mixture modeling
Holger Steinmetz and Peter Schmidt
University of Giessen / Germany
Überblick
Beobachtete vs. unbeobachtete Populationsheterogenität
Konzept der „kategorialen latenten Variable“
Latent class analyse (LCA) und finite mixtures
Anwendungsmöglichkeiten
Ein empirisches Beispiel: latent profile Analyse der 10 Werthaltungen (Schwartz, 1992) und Zusammenhänge mit demografischen Variablen
Beobachtete vs. unbeobachtete Populationsheterogenität
Gibt es Subpopulationen mit unterschiedlichen Parametern?
Parameter: - Antwortwahrscheinlichkeiten- Verteilungsmittelwerte und –varianzen- Modellparameter (Faktorladungen, Regressionskoeffizienten etc.)
Beobachtete Heterogenität- Gruppenzugehörigkeit ist bekannt- Analysen: t-Test, ANOVA, multigroup-Analysen
Beobachtete vs. unbeobachtete Populationsheterogenität
Unbeobachtete Heterogenität: Gruppenzugehörigkeit ist unbekannt
Ziele des mixture modeling:- Wieviele Subpopulationen („latent classes“) gibt es?- Welche Parameter gelten in ihnen?- Zuordnungswahrscheinlichkeiten für die Individuen der Stichprobe
Anwendungsgebiete:- Klinische Psychologie: Psychische Störungen als latente Klassen- Marktforschung: Marktsegmentierung- Pädagogische Psychologie: Mastery-Typen in der Schule
Latent Class Analyse (LCA)
Begründet durch Lazarsfeld und Henry (1968), Goodman (1974), Clogg (1995) u.a.
Dichotome / binäre items (uj)
C U
C = latente kategoriale Variable mit 1, 2, …k Kategorien Ziele / Ergebnis:
- Klassenspezifische Wahrscheinlichkeiten: P(u=1 | c=k)Beispiel zwei Klassen (k = 2):
Pc=1c=1(u = 1) = .85
Pc=2c=2(u = 1) = .40
- Wahrscheinlichkeit der Klassenzugehörigkeit: P(c = k) - Posterior-Wahrscheinlichkeit: P(c=k | u=1)
Latent Class Analyse (LCA)
Erweiterung: Die latente Klassenvariable erklärt die Kovarianz mehrerer Items (lokale stochastische Unabhängigkeit)
C
U1
U2
Latent Class Analyse (LCA)
5% 8%
9% 78%
U1: „Kontollverlust beim Trinken von Alkohol?“
ja nein
ja
nein
U2: „Blackout nach dem Trinken?“
Latent Class Analyse (LCA)
Klasse 1: Normale Trinker
Klasse 2: Problemtrinker
78%9%
8%5%
ja nein
ja
nein
Kontrollverlust
Bla
ckou
t
C
Kontrollverlust
Blackout
Latent Class Analyse (LCA)
78%9%
8%5%
ja nein
ja
nein
Kontrollverlust
Bla
ckou
t C
Kontrollverlu
st
Blackout
86%5%
10%1%
ja nein
ja
nein
Kontrollverlust
Bla
ckou
t
1%9%
11%79%
ja nein
ja
nein
Kontrollverlust
Bla
ckou
tNormale Trinker
Problemtrinker
P(c=k) : .85 .15
Latent Class Analyse (LCA)
Normale Trinker
Problem-trinker
Kontrollverlust .24 .76 1.0
Blackout .39 .61 1.0
Posterior-Wahrscheinlichkeiten P(c=k | u=1)
78%9%
8%5%
ja nein
ja
nein
Kontrollverlust
Bla
ckou
t C
Kontrollverlu
st
Blackout
Latent Profile Analyse (LPA)
LCA mit kontinuierlich verteilten Items Die Klassen unterscheiden sich in ihren Mittelwerten
Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential problems and promising opportunities. Psychological Methods, 9 (1), 3-29.
Common factor model
Latent Profile Analyse (LPA)
LCA mit kontinuierlich verteilten Items Die Klassen unterscheiden sich in ihren Mittelwerten
Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential problems and promising opportunities. Psychological Methods, 9 (1), 3-29.
Common factor model LPA
Mixture modeling
21
1
2
Mixture modeling
2
2))(5.(
22
1)(
x
exf
Mixture modeling
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
21
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
1
2
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
21
1
2
Mixture modeling
1
)1)(5.(
2
2
2
12
1)(1
x
exf 2
)2)(5.(
2
2
2
22
1)(2
x
exf
Likelihood für Person i = 1*f1(x) + 2*f2(x)
21
1
2
Mixture modeling
1
))(5.(
2
2
2
12
1)(1 e
xy
ee
xf
2
))(5.(
2
2
2
22
1)(2 e
xy
ee
xf
u1
u2
u3
u4
C
Erweiterungen der finite mixtures
x
Erweiterungen der finite mixtures
Mixture Regressionsanalyse
x2
Y
X1
C=1
C=2u1
u2
u3
u4
y
x1
C
Erweiterungen der finite mixtures
C
Mixture CFA
x1
x2
x3
x4
Erweiterungen der finite mixtures
Mixture SEM
y1
y2
y3
y4
x1
x2
x3
x4
C
Erweiterungen der finite mixtures
Mixture Growth curve model
X T1 X T2 X T3 X T4
Intcpt. Slp
C
Slp2
Evaluation der Klassenanzahl
Fitmaße- Likelihood-ratio test: Nicht anwendbar- Vuong-Lo-Mendell-Rubin LR-Test- BIC = -2 logL + Anzahl der Parameter * ln(n)
Güte der Klassifikation: Entropie
Evaluation der Klassenanzahl
Evaluation der Klassenanzahl
Fitmaße- Likelihood-ratio test: Nicht anwendbar- Vuong-Lo-Mendell-Rubin LR-Test- BIC = -2 logL + Anzahl der Parameter * ln(n)
Güte der Klassifikation: Entropie
Plausbilität
Stichprobe: N = 1677 Personen aus der allgemeinen erwerbstätigen Bevölkerkung
Messinstrument- Portraits Values Questionnaire (Schwartz, 2001)- Demografische Merkmale (Geschlecht, Alter, Bildung)
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
Universalism
Benevolence
Conformity
Tradition
SecurityPower
Achievement
Hedonism
Stimulation
Self-direction
Self-transcendenceOpenness to Change
ConservationSelf-enhancement
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
Pow
Ach SD Hed Stim Ben
Uni
Trad
Sec
Con
Bildung dummy2
Geschlecht
Alter
Bildung dummy1
C
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
-1.5
-1
-0.5
0
0.5
1
1.5
ACH SD HED BEN UNI STIM SEC TRAD POW CON
Latent Class 1
Latent Class 2
Latent Class 3
Latent Class 4
LC1 12%Wichtig: Spaß, Stimulation, Selbstbestimmung Unwichtig: Sicherheit, Tradition und Konformität, Benevolenz, Universalismus
“Hedonisten”
LC2 34% Alles unwichtig “Nihilisten”
LC3 29%Wichtig: Benevolenz, Universalismus, Sicherheit Unwichtig: Leistung, Stimulation, Selbstbestimmung und Macht
“Altruisten”
LC4 25% Alles wichtig “Ja-Sager”
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
20
25
30
35
40
45
50
55
Hedonisten Nihilisten Altruisten Ja-Sager
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
10%
16%
29%
40% 40%
14%
21%
30%
Männer Frauen
Hedonisten Nihilisten Altruisten Ja-Sager
Ein empirisches Beispiel: Latent profile analyse von Werthaltungen
3%
21%
9%
39%
32%30%
17%
33%
41%
23%27%26%
Hauptschule Realschule Abitur
Hedonisten Nihilisten Altruisten Ja-Sager
Top Related