1 Confirmatory Factor Analysis 第六章 驗證型因素分析. 2 大綱 * 6.1 前言 * 6.2...
-
date post
22-Dec-2015 -
Category
Documents
-
view
691 -
download
0
Transcript of 1 Confirmatory Factor Analysis 第六章 驗證型因素分析. 2 大綱 * 6.1 前言 * 6.2...
1
Confirmatory Factor Analysis
第六章 驗證型因素分析
2
大綱
* 6.1 前言 * 6.2 驗證型因素分析:如何運作 * 6.3 樣本問題 (略 )
* 6.4 驗證型因素分析之應用
3
6.1 前言 CFA屬於結構方程模式 (SEM with latent
variables)的一種次模型, CFA分析的數學原理與統計程序,都是 SEM的一種特殊應用。
CFA的進行必須有特定理論依據或概念架構作為基礎,然後藉由數學程序來確認該理論觀點所導出的計量模型是否確實、適當。
CFA的參數估計可採最大概似估計法,而非矩陣分解,其優點為提供模型適合度檢定統計量的值提供估計參數之標準誤
4
探索型因素分析與驗證型因素分析之比較
EFA(第五章 )
CFA(第六章 )
理論架構在分析過程中所扮演的角色
理論架構是因素分析後的產物
須先有特定的理論觀點作為基礎,再決定該架構是否適當。
理論架構在分析過程中所扮演的檢驗時機
事後概念 事前概念
5
6.1.1 應用 (一 )檢定因子模型之適合度 透過驗證性因素分析,可針對特定因子模型衡量適合度,並測試其適當與否。
案例- Benjamin and Podolny(1996)想瞭解美國加州不同區域栽培葡萄的等級狀態,聘請 10位專家對 73個不同區域加以評等,評等等級為 1(狀態差 )~7(狀態佳 )。最後選取資料較完整 (完成 59個不同區域評等 )的 5位專家。
6
單因子模型 (測量模型 )
等級狀態
X1 X2 X3 X4 X5
δ1 δ2 δ3 δ4 δ5
λ1λ2
λ3 λ4
λ5
7
Table 6.1 相關係數矩陣 (五位專家對59個不同區域製酒狀態評等 )
CFA可計算模型適合度指標,以驗證單因子模型是否適合樣本資料的相關結構
透過驗證型因素分析,可以檢查因子結構狀態及專家的可靠度 (測量信度 )。
以此題為例,相關係數均很高,故可知專家評等結果應該具一致性。 CFA可提供信度及效度 (收斂效度與區別效度 )分析。
X1 X2 X3 X4 X5 X1 1.00000 0.76490 0.67821 0.67515 0.68186 X2 0.76490 1.00000 0.73522 0.62564 0.76585 X3 0.67821 0.73522 1.00000 0.63170 0.71356 X4 0.67515 0.62564 0.63170 1.00000 0.51748 X5 0.68186 0.76585 0.71356 0.51748 1.00000
8
(二 )評估建構 (construct)的信效度
進行 CFA時,可以使用模式配適度統計量 (χ2)值與相關配適度指標 (GFI、 AGFI)來衡量變項的信度(reliability)與效度 (validity)。
信度:指標變數與潛伏變數之間相關程度 (>0.7)
效度:可分為下列兩種收歛效度 (convergent validity):對相同特性
(construct, concept, or research variables)使用不同衡量方法 (Likert scale, Stapel scale, or semantic differential),所得結果高度相關。
區別效度 (discriminant validity):不同建構 (construct, 即研究變數或稱 concept) 彼此之間確實不相同。
9
Multitrait–multimethod matrix (多重特質多重方法 )
圖 6.1 1. 李克尺度: Strongly Generally Moderately Moderately Generally Strongly Agree Agree Agree Disagree Disagree Disagree “Selection is wide.” ____ ____ ____ ____ ____ ____
2. 語言差異尺度: Extremely Quite Slight Slight Quite Exremely
Wide Selection ____ ____ ____ ____ ____ ____ Limited Selection
3. 史德培尺度: +3 ___
+2 ___ +1 ___ Wide Selection -1 ___ -2 ___ -3 ___
10
表 6.2 相關係數矩陣 (針對連鎖商店的兩個特徵 (store appearance, A and product assortment,
P)分別採用三種不同方法 (Likert scale, L,
Differential scale, D, and Stapel scale, S) )
AL AD AS PL PD PS
AL 1.000 AD 0.776 1.000 AS 0.676 0.739 1.000 PL 0.638 0.600 0.539 1.000 PD 0.561 0.635 0.527 0.713 1.000 PS 0.522 0.559 0.589 0.720 0.698 1.000
11
6.2 驗證型因素分析:如何運作
12
圖 6.2 兩因子模型路徑圖:學生智力測驗模型
ξ1
X1
ξ2
x2 x3 x4 x5
δ1 δ2 δ3 δ4 δ5
φ12
13
6.2.1 Intuition
執行驗證型因素分析時,應優先使用樣本共變數矩陣,而非相關係數矩陣。此處因資料出版問題,無法取得共變數矩陣,故以相關係數矩陣做分析。
1.000 .722 .714 .203 .095
.722 1.000 .685 .246 .181
R = .714 .685 1.000 .170 .113
.203 .246 .170 1.000 .585
.095 .181 .113 .585 1.000
14
X1 = λ11ξ1 + λ12ξ2 + δ1
X2 = λ21ξ1 + λ22ξ2 + δ2
X3 = λ31ξ1 + λ32ξ2 + δ3 (6.1)
X4 = λ41ξ1 + λ42ξ2 + δ4
X5 = λ51ξ1 + λ52ξ2 + δ5
X1 = λ11ξ1 + δ1
X2 = λ21ξ1 + δ2
X3 = λ31ξ1 + δ3 (6.2)
X4 = +λ42ξ2 + δ4
X5 = +λ52ξ2 + δ5
Corr(ξ1,ξ2) = φ12, var(ξ1)=φ11, var(ξ2)=φ22
探索性因子分析模型
驗證型因子分析模型
15
CFA模型的尺度不定性(scaling indeterminancy)
Var(ξi)與所有的 λij的值不能同時決定,兩者有抵換關係
尺度不定性的解決方法 :1. 令每個因子的變異數為 1, 或2. 將每一個因子與負荷在其上的變數間的 λ值任選一個,並訂其值為 1
16
λ11 0
λ21 0
factor loadings matrix Λ = λ31 0
0 λ42
0 λ52
222
factor correlation matrix 1 ψ12
ψ21 1
17
(6.3)
1 2 11 1 1 21 1 2 11 21
1 3 11 1 1 31 1 3 11 31
1 4 11 1 1 42 2 4 11 1 2 42
11 12 42
1 5 11 1 1 5
( , ) ( , ) 0.722
( , ) ( , ) 0.714
(
.
, ) ( , ) ( , )
0.203
( , ( ,
.
)
corr X X corr
corr X X corr
corr X X corr corr
corr X X corr
2 2 5 11 1 2 52
11 12 52
2 3 21 1 2 32 1 3 21 31
2 4 21 1 2 42 2 4 21 1 2 42
21 12 42
2 5 21 1 2 5
) ( , )
0.095
( , ) ( , ) 0.685
( , ) ( , ) ( , )
0.246
( ,
..
..
) ( ,
corr
corr X X corr
corr X X corr corr
corr X X corr
2 2 5 21 1 2 52
21 12 52
3 4 31 1 3 42 2 4 31 1 2 42
31 12 42
3 5 31 1 3 52 2 5 31 1 2 52
31 12 52
)
..
..
..
( , )
0.181
( , ) ( , ) ( , )
0.170
( , ) ( , ) ( , )
0.113
corr
corr X X corr corr
corr X X corr corr
4 5 42 2 4 52 2 5 42 52( , ) ( , ) 0.585corr X X corr
18
1),corr(
,1),corr(
,1),corr(
,1),corr(
,1),corr(
5525255
4424244
3323133
2222122
1121111
XX
XX
XX
XX
XX
19
適合度指標 (p.181)
衡量信度 (p.183)
(6.5)
22 ln lnR FL L (6.4)
2 22
2 21X
X X
~
20
衡量指標
衡量指標 說明
χ2
卡方值χ2易受樣本量大小影響,當樣本量較大時,易導致拒絕虛無假設,因此建議與其他指標同時考量。
虛無假設- the proposed model fits as well as a perfect model
22 ln lnR FL L
21
適合度衡量指標 說明 數值 (0~1)
GFI 配適度指標(goodness of fit index)
不受樣本大小影響,可用於不同模型之間的比較。
> 0.95: good level
> 0.90: acceptable
level
AGFI 調整後配適度指標(adjusted goodness of fit index)
> 0.90: good level
> 0.80: acceptable
level
RMR 殘差平方根(root mean square residual)
反應理論假設模型的整體殘差
< 0.05, 越接近 0越好
22
Measure Reliability (信度 )
定義 :
計算方式 Test-retest CFA λ2
2 22
2 21X
X X
2
21 Xxxr
信度需>0.7
23
6.2.2 Mechanism (P.184)
(6.6)
(6.7)
X
1/ 2
1
1
12 exp
2
n
i ii
L
'' )(Var)(Var X
Likelihood
function
假設 Xi~N(0, Σ)
24
(6.10)
(6.11)
(6.12)
1
1
1 1 1ln ln 2 ln
2 2 2
n
i ii
L
1
1
1ln 2 ln
2 2 2
n
i ii
n n
11ln ln 2 ln
2
nL tr
n
1ln ln2
nL tr S
Final version of the log likelihood function
Obtain parameter estimates to maximize 6.12
MLE
25
模式適合度檢定
1ln2
)ln( Strn
LR
][ln2
)]([ln2
)ln( 1 pSn
SStrSn
LF
21 ~]ln)([ln)]ln()[ln(2 pSStrnLL FR
H0: Reduced model is indifferent from full model
Ha: two models are significantly different
Set α=0.2 對 n極為敏感
26
21
211tr S I
GFItr S
(6.16)
21
21
11
2
tr S Ip pAGFI
df tr S
(6.17)
其他替代的模式適合度指標
>0.95 good fit>0.9 acceptable
fit
>0.9 good fit>0.8 acceptable
fit
27
Sample Problems
28
操作軟體: Lisrel
LISREL是一套用於 SEM分析的統計套裝軟體。本章我們採用LISREL 8.7版做分析。
29
軟體操作 :學生智力測驗成績 (P.181)
30
軟體操作 :學生智力測驗成績 (P.181)
31
Title Confirmatory Factor Analysis for student test performanceObserved Variables 文章閱讀 造句能力 字彙能力 加法能力 計數能力Correlation Matrix= 1 0.722 1 0.714 0.685 1 0.203 0.246 0.170 1 0.095 0.181 0.113 0.585 1Sample Size=145Latent Variables 語言 數學Relationships: 文章閱讀 = 語言 造句能力 = 語言 字彙能力 =語言 加法能力 = 數學 計數能力 =數學SET the Covariance of 語言 and 數學 to 1 Path DiagramLISREL OUTPUT SE TV RS MI
相關矩陣
指標變數
潛伏變數
定義指標變數與潛伏變數之關係
輸出指令SE: 標準誤TV: t檢定RS: 常態化殘差與 Q圖MI: 修飾指標
軟體操作 :學生智力測驗成績 (P.181)
32
軟體操作 :學生智力測驗成績 (P.181)
33
GFI=0.99AGFI=0.97RMR=0.022
卡方值 =2.93
軟體操作 :學生智力測驗成績 (P.181)
34
Questions Regarding the Application of CFA
35
Cronbach’s alpha (6.18)
其值介於 0~1之間,若項目間相關係越高, α值越高,亦即內部一致性越高。此公式假設指標內各 item重要性一樣。
(6.19)
1 1
kr
k r
6.4.1 如何評估指標的信度Average inter-item correlation among k items
k
iii
k
ii
k
ii
C
1
2
2
1
2
12
此公式反映指標內各item重要性不一樣
36
例題 : 製酒企業(P.172)
Benjamin and Podolny(1996)想瞭解美國加洲不同區域栽培葡萄的狀態,聘請 10位專家對 73個不同區域加以評等,評等等級為 1(狀態差 )~7(狀態佳 )。最後選取資料較完整 (完成 59個不同區域評等 )的 5位專家。
樣本量 : 59個不同區域指標變數: 5位專家潛伏變數: status
37
路徑圖:製酒企業(P.188)
status
expert3expert2expert1 expert5expert4
χ2 、GFI、 AGFI、 RM
R
採用 Single dimension
δ1 δ2 δ3 δ4 δ5
Cronbach’s α=0.91
38
例題一 :製酒企業 (P.188)
Title Confirmatory Factor Analysis for Wine IndustryObserved Variables expert1 expert2 expert3 expert4 expert5Correlation Matrix= 1 0.765 1 0.678 0.735 1 0.675 0.626 0.632 1 0.682 0.766 0.714 0.517 1Sample Size=59Latent Variables StatusRelationships: expert1=Status expert2=Status expert3=Status expert4=Status expert5=StatusPath DiagramLISREL OUTPUT SE TV RS MI
Title:整個語法的標題
指標變數
相關矩陣 :相關性高
樣本量潛伏變數命名
指標變數與潛伏變數的關係
繪製路徑圖
輸出指令SE: 標準誤TV: t檢定RS: 常態化殘差與 Q圖MI: 修飾指標
39
例題一 :製酒企業 (P.189)
最可靠,信度最佳
最不可靠,信度最低
40
例題一 :製酒企業(p.189)
參數最大概似估計、標準誤、 t值 :t值顯著 >2
殘差變異數估計、標準誤、 t值 :t值 >2仍顯著
41
GFI = 0.96 >0.95 (佳 )AGFI= 0.87 >0.8 (可接受 )RMR = 0.031<0.05 (可接受 )
例題 : 製酒企業 (p.189)
卡方值χ2 = 6.57
42
利用 CFA檢定模式參數 (見 P.190)檢定ㄧ個因子以上 (P.191)
透過驗證性因素分析,我們可以進行統計檢定,是否選擇多因子模型比單因子模型更合適。
6.4.2 如何比較不同因子模型
43
例題 : 學生智力測驗成績(P.191)
之前分析建立在兩因子模型下 (P.180),且能提供良好適合度,本例題測試在單因子模型下是否能提供更加適合度?
樣本數 : 145個學生 指標變數:文章閱讀 , 造句能力 , 字彙能力 ,
加法能力 , 計數能力潛伏變數:語言 , 數學
44
路徑圖: 學生智力測驗成績 (P.192)
語言
文章閱讀
χ2 、GFI、 AGFI、
數學
造句能力
字彙能力
加法能力
計數能力
=1
採用 Single dimension
δ1 δ2 δ3δ4 δ5
45
Title Confirmatory Factor Analysis for student test performanceObserved Variables 文章閱讀 造句能力 字彙能力 加法能力 計數能力Correlation Matrix= 1 0.722 1 0.714 0.685 1 0.203 0.246 0.170 1 0.095 0.181 0.113 0.585 1Sample Size=145Latent Variables 語言 數學Relationships: 文章閱讀 = 語言 造句能力 = 語言 字彙能力 =語言 加法能力 = 數學 計數能力 =數學SET the Covariance of 語言 and 數學 to 1 Path DiagramLISREL OUTPUT SE TV RS MI
相關矩陣
指標變數
潛伏變數
定義指標變數與潛伏變數之關係
軟體操作 : 學生智力測驗成績 (P.192)
定義潛伏變數之間的關係相關係數為 1,不具區別效度 輸出指令
SE: 標準誤TV: t檢定RS: 常態化殘差與 Q圖MI: 修飾指標
46
軟體操作 : 學生智力測驗成績(P.192)
47
軟體操作 : 學生智力測驗成績(P.192)
參數最大概似估計、標準誤、 t值 :語言 :相關性較大、標準誤 0.07、 t值顯著 >2數學 :相關性小、標準誤 0.09、 t值 <2不顯著兩潛伏變數之間的相關係數為 1
殘差變異數估計、標準誤、 t值
48
軟體操作 : 學生智力測驗成績(P.192)
卡方值χ2 = 59.47
GFI = 0.88 <0.90 AGFI= 0.63 <0.80RMR = 0.14 >0.05 (皆低於可接受水準 ) 模型配適度不佳
49
學生智力測驗成績-綜合比較二因子模型
P.183 Table 6.3
單因子模型P.191 Table 6.5
卡方值 2.93 59.47
GFI 0.99 0.88
AGFI 0.97 0.63
單因子模型下 :GFI AGFI 皆低於可接受水準,故潛伏變數兼具區別性,應採二因子模型較合適。
50
限制或一般模型 (P.192)
目的- 檢定較精簡的限制模型是否和所觀察的資料具ㄧ致性
6.4.2 如何比較不同因子模型
51
例題 : 製酒企業(P.193)
之前分析建立在專家之間的信度不相同的情況(P.189),能提供良好適合度,本例題測試在專家之間的信度皆相同之情況下,是否能提供更佳適合度?
樣本量 : 59個不同區域指標變數: 5位專家潛伏變數: status
52
路徑圖:製酒企業 (P.193)
status
expert3expert2expert1 expert5expert4
χ2 、GFI、 AGFI、 RM
R
δ1 δ2 δ3 δ4 δ5
53
Title Confirmatory Factor Analysis for Wine Inc. - restricted model Observed Variables expert1 expert2 expert3 expert4 expert5Correlation Matrix= 1 0.765 1 0.678 0.735 1 0.675 0.626 0.632 1 0.682 0.766 0.714 0.517 1Sample Size=59Latent Variables StatusRelationships: expert1=Status expert2=Status expert3=Status expert4=Status expert5=StatusSET the path from Status to expert1 equal to the path from Status to expert2SET the path from Status to expert2 equal to the path from Status to expert3SET the path from Status to expert3 equal to the path from Status to expert4SET the path from Status to expert4 equal to the path from Status to expert5Equal error variances: expert1 expert2 expert3 expert4 expert5Path DiagramLISREL OUTPUT SE TV RS MI
軟體操作 : 製酒企業(P.193)
相關矩陣
指標變數
潛伏變數
定義指標變數與潛伏變數之關係
定義潛伏變數之間的關係
輸出指令SE: 標準誤TV: t檢定RS: 常態化殘差MI: 修飾指標
54
軟體操作 : 製酒企業 (P.193)
55
軟體操作 : 製酒企業 (P.193)
參數最大概似估計、標準誤、 t值
殘差變異數估計、標準誤、 t
值
56
軟體操作 : 製酒企業 (P.193)
卡方值
GFI (acceptable)、 AGFI (acceptable)、 RMR
57
製酒企業-綜合比較 (p.193)
專家之間信度
不相同 (一般模型 )
P.189 Table 6.4
相同 (限制模型 )
P.193 Table 6.6
卡方值 (自由度 )
6.57
(5)
15.62
(13)
GFI 0.96 0.90
AGFI 0.87 0.88
兩個模型的 performance相當,基於 parsimony原則,故選擇限制模型。
58
考量其他不同簡單結構以外的衡量方法
6.4.3 簡單因子結構之外的變化 (P.193)
59
例題 : 連鎖商店 (p.194)
Menezes and Elber(1979)使用多重衡量方法,李克尺度 (Likert Scale)、語意差異尺度 (Semantic differential Scale)、史德培尺度 (Stapel Scale)評估連鎖商店的商店外觀 (store appearance)與產品多樣化(product assortment)特徵,樣本來源為 250位夜校學生。
樣本量 : 250
指標變數: AL、 AD、 AS、 PL、 PD、 PS
潛伏變數: store appearance、 product assortment
60
路徑圖:連鎖商店 -Simple Model (P.194)
appearance
AL
χ2 、GFI、 AGFI、
assortment
AD AS PL PD PS
δ1 δ2 δ3 δ4 δ5 δ6
61
Title Confirmatory Factor Analysis for Store Grocery- Simple modelObserved Variables AL AD AS PL PD PSCorrelation Matrix= 1.000 0.776 1.000 0.676 0.739 1.000 0.638 0.600 0.539 1.000 0.561 0.635 0.527 0.713 1.000 0.522 0.559 0.589 0.720 0.698 1.000Sample Size=250Latent Variables APPEARANCE PRODUCTRelationships: AL=APPEARANCE AD=APPEARANCE AS=APPEARANCE PL=PRODUCT PD=PRODUCT PS=PRODUCTPath DiagramLISREL OUTPUT SE TV RS MI
相關矩陣
指標變數
潛伏變數
定義指標變數與潛伏變數之關係
輸出指令SE: 標準誤TV: t檢定RS: 常態化殘差與 Q圖MI: 修飾指標
軟體操作 :連鎖商店 -Simple Model
62
軟體操作 :連鎖商店 - Simple Model (P.195)
63
參數最大概似估計、標準誤、 t值
兩潛伏變數之間的相關性
軟體操作 :連鎖商店 -Simple Model (P.195)
64
殘差變異數估計、標準誤、 t值
卡方值
近似標準殘差矩陣Asymptotically Standardized
Residual Matrix
軟體操作 :連鎖商店 - Simple Model (P.195)
GFI (good)、AGFI (acceptable)
65
採用 (multitrait, multimethed model,MTMM) 多重特質多重方法,以測量理論架構的效度。
收歛效度 (convergent validity):對相同特性使用不同衡量方法,所得結果高度相關。
區別效度 (discriminant):不同構面彼此之間確實不相同。 (不完全相關 )
例題 :連鎖商店 -Method Factors (P.194)
66
11 12 42 13 43,corr AL PL
11 1 13 3 1
42 2 43 3 4
AL
PL
13 43 .3
24 54 .4
35 65 .5
67
11 .3
21 .4
31 .5
42 .3
52 .4
62 .5
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
68
路徑圖:連鎖商店 -Method Factors(P.197)
appearance
AL
χ2 、GFI、 AGFI、
product
AD AS PL PD PS
Semantic differential
StapelLikert
(參 p.194)考量方法因素,使用相同尺度衡量不同因素。
69
軟體操作 :連鎖商店 -Method Factors (P.196)
相關矩陣
增加三個潛伏變數
定義指標變數與潛伏變數的關係
定義潛伏變數之間的關係
70
軟體操作 :連鎖商店 -Method Factors (P.195)
新增部分 參數最大
概似估計殘差項係數
71
軟體操作 :連鎖商店 -Method Factors (P.195)
額外增加三種衡量尺度的參數最大概似估計
參數最大概似估計
兩潛伏變數之間的關係
72
軟體操作 :連鎖商店 -Method Factors (P.195)
殘差變異數估計
卡方值、自由度
GFI、 AGFI、 RMR
73
在 Simple Model中,未考量殘差之間的相關性,現在我們加入殘差項之間的共變性,加以研究。
例題 : 連鎖商店 -Correlated Error (P.197)
參考P.197
74
211 14
222 25
233 36
241 44
252 55
263 66
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
75
路徑圖:連鎖商店 - Correlated Error (P.198)
appearance
AL
product
AD AS PL PD PS
考量誤差項
加入殘差項之間的共變性
δ1 δ2 δ3 δ4 δ5 δ6
76
軟體操作 :連鎖商店 - Correlated Error
Title EX1: Confirmatory Factor Analysis for grocery store-correlated errorObserved Variables AL AD AS PL PD PS Correlation Matrix= 1.000 0.776 1.000 0.676 0.739 1.000 0.638 0.600 0.539 1.000 0.561 0.635 0.527 0.713 1.000 0.522 0.559 0.589 0.720 0.698 1.000Sample Size=250Latent Variables APPEARANCE PRODUCTRelationships: AL=APPEARANCE AD=APPEARANCE AS=APPEARANCE PL=PRODUCT PD=PRODUCT PS=PRODUCTSET the errors between AL and PL correlateSET the errors between AD and PD correlateSET the errors between AS and PS correlate Path DiagramLISREL OUTPUT SE TV RS MI
相關矩陣
對潛在變數進行標籤
定義指標變數與潛伏變數的關係
定義殘差的關係
77
軟體操作 :連鎖商店 - Correlated Error (P.195)
新增誤差項部分
參數最大概似估計
殘差項係數
78
參數最大概似估計、標準誤、 t值
軟體操作 :連鎖商店 - Correlated Error (P.195)
兩潛伏變數之間的關係
79
殘差變異數估計、標準誤、 t值
誤差變異數估計、標準誤、 t值
卡方值
軟體操作 :連鎖商店 - Correlated Error (P.195)
80
軟體操作 :連鎖商店 - Correlated Error (P.195)
GFI(good)、 AGFI(good)、 RMR
81
實地演練
82
~ The End ~