1 Confirmatory Factor Analysis 第六章驗證型因素分析. 2 大綱＊ 6.1 前言＊ 6.2...

1

Confirmatory Factor Analysis

第六章驗證型因素分析

2

大綱

＊ 6.1 前言＊ 6.2 驗證型因素分析：如何運作＊ 6.3 樣本問題 (略 )

＊ 6.4 驗證型因素分析之應用

3

6.1 前言 CFA屬於結構方程模式 (SEM with latent

variables)的一種次模型， CFA分析的數學原理與統計程序，都是 SEM的一種特殊應用。

CFA的進行必須有特定理論依據或概念架構作為基礎，然後藉由數學程序來確認該理論觀點所導出的計量模型是否確實、適當。

CFA的參數估計可採最大概似估計法，而非矩陣分解，其優點為提供模型適合度檢定統計量的值提供估計參數之標準誤

4

探索型因素分析與驗證型因素分析之比較

EFA(第五章 )

CFA(第六章 )

理論架構在分析過程中所扮演的角色

理論架構是因素分析後的產物

須先有特定的理論觀點作為基礎，再決定該架構是否適當。

理論架構在分析過程中所扮演的檢驗時機

事後概念事前概念

5

6.1.1 應用 (一 )檢定因子模型之適合度透過驗證性因素分析，可針對特定因子模型衡量適合度，並測試其適當與否。

案例－ Benjamin and Podolny(1996)想瞭解美國加州不同區域栽培葡萄的等級狀態，聘請 10位專家對 73個不同區域加以評等，評等等級為 1(狀態差 )~7(狀態佳 )。最後選取資料較完整 (完成 59個不同區域評等 )的 5位專家。

6

單因子模型 (測量模型 )

等級狀態

X1 X2 X3 X4 X5

δ1 δ2 δ3 δ4 δ5

λ1λ2

λ3 λ4

λ5

7

Table 6.1 相關係數矩陣 (五位專家對59個不同區域製酒狀態評等 )

CFA可計算模型適合度指標，以驗證單因子模型是否適合樣本資料的相關結構

透過驗證型因素分析，可以檢查因子結構狀態及專家的可靠度 (測量信度 )。

以此題為例，相關係數均很高，故可知專家評等結果應該具一致性。 CFA可提供信度及效度 (收斂效度與區別效度 )分析。

X1 X2 X3 X4 X5 X1 1.00000 0.76490 0.67821 0.67515 0.68186 X2 0.76490 1.00000 0.73522 0.62564 0.76585 X3 0.67821 0.73522 1.00000 0.63170 0.71356 X4 0.67515 0.62564 0.63170 1.00000 0.51748 X5 0.68186 0.76585 0.71356 0.51748 1.00000

8

(二 )評估建構 (construct)的信效度

進行 CFA時，可以使用模式配適度統計量 (χ2)值與相關配適度指標 (GFI、 AGFI)來衡量變項的信度(reliability)與效度 (validity)。

信度：指標變數與潛伏變數之間相關程度 (>0.7)

效度：可分為下列兩種收歛效度 (convergent validity)：對相同特性

(construct, concept, or research variables)使用不同衡量方法 (Likert scale, Stapel scale, or semantic differential)，所得結果高度相關。

區別效度 (discriminant validity)：不同建構 (construct, 即研究變數或稱 concept) 彼此之間確實不相同。

9

Multitrait–multimethod matrix (多重特質多重方法 )

圖 6.1 1. 李克尺度： Strongly Generally Moderately Moderately Generally Strongly Agree Agree Agree Disagree Disagree Disagree “Selection is wide.” ____ ____ ____ ____ ____ ____

2. 語言差異尺度： Extremely Quite Slight Slight Quite Exremely

Wide Selection ____ ____ ____ ____ ____ ____ Limited Selection

3. 史德培尺度： +3 ___

+2 ___ +1 ___ Wide Selection -1 ___ -2 ___ -3 ___

10

表 6.2 相關係數矩陣 (針對連鎖商店的兩個特徵 (store appearance, A and product assortment,

P)分別採用三種不同方法 (Likert scale, L,

Differential scale, D, and Stapel scale, S) )

AL AD AS PL PD PS

AL 1.000 AD 0.776 1.000 AS 0.676 0.739 1.000 PL 0.638 0.600 0.539 1.000 PD 0.561 0.635 0.527 0.713 1.000 PS 0.522 0.559 0.589 0.720 0.698 1.000

11

6.2 驗證型因素分析：如何運作

12

圖 6.2 兩因子模型路徑圖：學生智力測驗模型

ξ1

X1

ξ2

x2 x3 x4 x5

δ1 δ2 δ3 δ4 δ5

φ12

13

6.2.1 Intuition

執行驗證型因素分析時，應優先使用樣本共變數矩陣，而非相關係數矩陣。此處因資料出版問題，無法取得共變數矩陣，故以相關係數矩陣做分析。

1.000 .722 .714 .203 .095

.722 1.000 .685 .246 .181

R = .714 .685 1.000 .170 .113

.203 .246 .170 1.000 .585

.095 .181 .113 .585 1.000

14

X1 = λ11ξ1 + λ12ξ2 + δ1

X2 = λ21ξ1 + λ22ξ2 + δ2

X3 = λ31ξ1 + λ32ξ2 + δ3 (6.1)

X4 = λ41ξ1 + λ42ξ2 + δ4

X5 = λ51ξ1 + λ52ξ2 + δ5

X1 = λ11ξ1 + δ1

X2 = λ21ξ1 + δ2

X3 = λ31ξ1 + δ3 (6.2)

X4 = +λ42ξ2 + δ4

X5 = +λ52ξ2 + δ5

Corr(ξ1,ξ2) = φ12, var(ξ1)=φ11, var(ξ2)=φ22

探索性因子分析模型

驗證型因子分析模型

15

CFA模型的尺度不定性(scaling indeterminancy)

Var(ξi)與所有的 λij的值不能同時決定，兩者有抵換關係

尺度不定性的解決方法 :1. 令每個因子的變異數為 1, 或2. 將每一個因子與負荷在其上的變數間的 λ值任選一個，並訂其值為 1

16

λ11 0

λ21 0

factor loadings matrix Λ = λ31 0

0 λ42

0 λ52

222

factor correlation matrix 1 ψ12

ψ21 1

17

(6.3)

1 2 11 1 1 21 1 2 11 21

1 3 11 1 1 31 1 3 11 31

1 4 11 1 1 42 2 4 11 1 2 42

11 12 42

1 5 11 1 1 5

( , ) ( , ) 0.722

( , ) ( , ) 0.714

(

.

, ) ( , ) ( , )

0.203

( , ( ,

.

)

corr X X corr

corr X X corr

corr X X corr corr

corr X X corr

2 2 5 11 1 2 52

11 12 52

2 3 21 1 2 32 1 3 21 31

2 4 21 1 2 42 2 4 21 1 2 42

21 12 42

2 5 21 1 2 5

) ( , )

0.095

( , ) ( , ) 0.685

( , ) ( , ) ( , )

0.246

( ,

..

..

) ( ,

corr

corr X X corr

corr X X corr corr

corr X X corr

2 2 5 21 1 2 52

21 12 52

3 4 31 1 3 42 2 4 31 1 2 42

31 12 42

3 5 31 1 3 52 2 5 31 1 2 52

31 12 52

)

..

..

..

( , )

0.181

( , ) ( , ) ( , )

0.170

( , ) ( , ) ( , )

0.113

corr

corr X X corr corr

corr X X corr corr

4 5 42 2 4 52 2 5 42 52( , ) ( , ) 0.585corr X X corr

18

1),corr(

,1),corr(

,1),corr(

,1),corr(

,1),corr(

5525255

4424244

3323133

2222122

1121111

XX

XX

XX

XX

XX

19

適合度指標 (p.181)

衡量信度 (p.183)

(6.5)

22 ln lnR FL L (6.4)

2 22

2 21X

X X

~

20

衡量指標

衡量指標說明

χ2

卡方值χ2易受樣本量大小影響，當樣本量較大時，易導致拒絕虛無假設，因此建議與其他指標同時考量。

虛無假設－ the proposed model fits as well as a perfect model

22 ln lnR FL L

21

適合度衡量指標說明數值 (0~1)

GFI 配適度指標(goodness of fit index)

不受樣本大小影響，可用於不同模型之間的比較。

＞ 0.95： good level

＞ 0.90： acceptable

level

AGFI 調整後配適度指標(adjusted goodness of fit index)

＞ 0.90： good level

＞ 0.80： acceptable

level

RMR 殘差平方根(root mean square residual)

反應理論假設模型的整體殘差

＜ 0.05，越接近 0越好

22

Measure Reliability (信度 )

定義 :

計算方式 Test-retest CFA λ2

2 22

2 21X

X X

2

21 Xxxr

信度需>0.7

23

6.2.2 Mechanism (P.184)

(6.6)

(6.7)

X

1/ 2

1

1

12 exp

2

n

i ii

L

'' )(Var)(Var X

Likelihood

function

假設 Xi~N(0, Σ)

24

(6.10)

(6.11)

(6.12)

1

1

1 1 1ln ln 2 ln

2 2 2

n

i ii

L

1

1

1ln 2 ln

2 2 2

n

i ii

n n

11ln ln 2 ln

2

nL tr

n

1ln ln2

nL tr S

Final version of the log likelihood function

Obtain parameter estimates to maximize 6.12

MLE

25

模式適合度檢定

1ln2

)ln( Strn

LR

][ln2

)]([ln2

)ln( 1 pSn

SStrSn

LF

21 ~]ln)([ln)]ln()[ln(2 pSStrnLL FR

H0: Reduced model is indifferent from full model

Ha: two models are significantly different

Set α=0.2 對 n極為敏感

26

21

211tr S I

GFItr S

(6.16)

21

21

11

2

tr S Ip pAGFI

df tr S

(6.17)

其他替代的模式適合度指標

>0.95 good fit>0.9 acceptable

fit

>0.9 good fit>0.8 acceptable

fit

27

Sample Problems

28

操作軟體： Lisrel

LISREL是一套用於 SEM分析的統計套裝軟體。本章我們採用LISREL 8.7版做分析。

29

軟體操作 :學生智力測驗成績 (P.181)

30


31

Title Confirmatory Factor Analysis for student test performanceObserved Variables 文章閱讀造句能力字彙能力加法能力計數能力Correlation Matrix= 1 0.722 1 0.714 0.685 1 0.203 0.246 0.170 1 0.095 0.181 0.113 0.585 1Sample Size=145Latent Variables 語言數學Relationships: 文章閱讀 = 語言造句能力 = 語言字彙能力 =語言加法能力 = 數學計數能力 =數學SET the Covariance of 語言 and 數學 to 1 Path DiagramLISREL OUTPUT SE TV RS MI

相關矩陣

指標變數

潛伏變數

定義指標變數與潛伏變數之關係

輸出指令SE: 標準誤TV: t檢定RS: 常態化殘差與 Q圖MI: 修飾指標


32


33

GFI=0.99AGFI=0.97RMR=0.022

卡方值 =2.93


34

Questions Regarding the Application of CFA

35

Cronbach’s alpha (6.18)

其值介於 0~1之間，若項目間相關係越高， α值越高，亦即內部一致性越高。此公式假設指標內各 item重要性一樣。

(6.19)

1 1

kr

k r

6.4.1 如何評估指標的信度Average inter-item correlation among k items

k

iii

k

ii

k

ii

C

1

2

2

1

2

12

此公式反映指標內各item重要性不一樣

36

例題 : 製酒企業(P.172)

Benjamin and Podolny(1996)想瞭解美國加洲不同區域栽培葡萄的狀態，聘請 10位專家對 73個不同區域加以評等，評等等級為 1(狀態差 )~7(狀態佳 )。最後選取資料較完整 (完成 59個不同區域評等 )的 5位專家。

樣本量： 59個不同區域指標變數： 5位專家潛伏變數： status

37

路徑圖：製酒企業(P.188)

status

expert3expert2expert1 expert5expert4

χ2 、GFI、 AGFI、 RM

R

採用 Single dimension

δ1 δ2 δ3 δ4 δ5

Cronbach’s α=0.91

38

例題一 :製酒企業 (P.188)

Title Confirmatory Factor Analysis for Wine IndustryObserved Variables expert1 expert2 expert3 expert4 expert5Correlation Matrix= 1 0.765 1 0.678 0.735 1 0.675 0.626 0.632 1 0.682 0.766 0.714 0.517 1Sample Size=59Latent Variables StatusRelationships: expert1=Status expert2=Status expert3=Status expert4=Status expert5=StatusPath DiagramLISREL OUTPUT SE TV RS MI

Title:整個語法的標題

指標變數

相關矩陣 :相關性高

樣本量潛伏變數命名

指標變數與潛伏變數的關係

繪製路徑圖


39

例題一 :製酒企業 (P.189)

最可靠，信度最佳

最不可靠，信度最低

40

例題一 :製酒企業(p.189)

參數最大概似估計、標準誤、 t值 :t值顯著 >2

殘差變異數估計、標準誤、 t值 :t值 >2仍顯著

41

GFI = 0.96 >0.95 (佳 )AGFI= 0.87 >0.8 (可接受 )RMR = 0.031<0.05 (可接受 )

例題 : 製酒企業 (p.189)

卡方值χ2 = 6.57

42

利用 CFA檢定模式參數 (見 P.190)檢定ㄧ個因子以上 (P.191)

透過驗證性因素分析，我們可以進行統計檢定，是否選擇多因子模型比單因子模型更合適。

6.4.2 如何比較不同因子模型

43

例題 : 學生智力測驗成績(P.191)

之前分析建立在兩因子模型下 (P.180)，且能提供良好適合度，本例題測試在單因子模型下是否能提供更加適合度？

樣本數： 145個學生指標變數：文章閱讀 , 造句能力 , 字彙能力 ,

加法能力 , 計數能力潛伏變數：語言 , 數學

44

路徑圖：學生智力測驗成績 (P.192)

語言

文章閱讀

χ2 、GFI、 AGFI、

數學

造句能力

字彙能力

加法能力

計數能力

=1

採用 Single dimension

δ1 δ2 δ3δ4 δ5

45

Title Confirmatory Factor Analysis for student test performanceObserved Variables 文章閱讀造句能力字彙能力加法能力計數能力Correlation Matrix= 1 0.722 1 0.714 0.685 1 0.203 0.246 0.170 1 0.095 0.181 0.113 0.585 1Sample Size=145Latent Variables 語言數學Relationships: 文章閱讀 = 語言造句能力 = 語言字彙能力 =語言加法能力 = 數學計數能力 =數學SET the Covariance of 語言 and 數學 to 1 Path DiagramLISREL OUTPUT SE TV RS MI

相關矩陣

指標變數

潛伏變數


軟體操作 : 學生智力測驗成績 (P.192)

定義潛伏變數之間的關係相關係數為 1，不具區別效度輸出指令

SE: 標準誤TV: t檢定RS: 常態化殘差與 Q圖MI: 修飾指標

46

軟體操作 : 學生智力測驗成績(P.192)

47


參數最大概似估計、標準誤、 t值 :語言 :相關性較大、標準誤 0.07、 t值顯著 >2數學 :相關性小、標準誤 0.09、 t值 <2不顯著兩潛伏變數之間的相關係數為 1

殘差變異數估計、標準誤、 t值

48


卡方值χ2 = 59.47

GFI = 0.88 <0.90 AGFI= 0.63 <0.80RMR = 0.14 >0.05 (皆低於可接受水準 ) 模型配適度不佳

49

學生智力測驗成績－綜合比較二因子模型

P.183 Table 6.3

單因子模型P.191 Table 6.5

卡方值 2.93 59.47

GFI 0.99 0.88

AGFI 0.97 0.63

單因子模型下 :GFI AGFI 皆低於可接受水準，故潛伏變數兼具區別性，應採二因子模型較合適。

50

限制或一般模型 (P.192)

目的－檢定較精簡的限制模型是否和所觀察的資料具ㄧ致性

6.4.2 如何比較不同因子模型

51

例題 : 製酒企業(P.193)

之前分析建立在專家之間的信度不相同的情況(P.189)，能提供良好適合度，本例題測試在專家之間的信度皆相同之情況下，是否能提供更佳適合度？

樣本量： 59個不同區域指標變數： 5位專家潛伏變數： status

52

路徑圖：製酒企業 (P.193)

status

expert3expert2expert1 expert5expert4

χ2 、GFI、 AGFI、 RM

R

δ1 δ2 δ3 δ4 δ5

53

Title Confirmatory Factor Analysis for Wine Inc. - restricted model Observed Variables expert1 expert2 expert3 expert4 expert5Correlation Matrix= 1 0.765 1 0.678 0.735 1 0.675 0.626 0.632 1 0.682 0.766 0.714 0.517 1Sample Size=59Latent Variables StatusRelationships: expert1=Status expert2=Status expert3=Status expert4=Status expert5=StatusSET the path from Status to expert1 equal to the path from Status to expert2SET the path from Status to expert2 equal to the path from Status to expert3SET the path from Status to expert3 equal to the path from Status to expert4SET the path from Status to expert4 equal to the path from Status to expert5Equal error variances: expert1 expert2 expert3 expert4 expert5Path DiagramLISREL OUTPUT SE TV RS MI

軟體操作 : 製酒企業(P.193)

相關矩陣

指標變數

潛伏變數


定義潛伏變數之間的關係

輸出指令SE: 標準誤TV: t檢定RS: 常態化殘差MI: 修飾指標

54

軟體操作 : 製酒企業 (P.193)

55


參數最大概似估計、標準誤、 t值

殘差變異數估計、標準誤、 t

值

56


卡方值

GFI (acceptable)、 AGFI (acceptable)、 RMR

57

製酒企業－綜合比較 (p.193)

專家之間信度

不相同 (一般模型 )

P.189 Table 6.4

相同 (限制模型 )

P.193 Table 6.6

卡方值 (自由度 )

6.57

(5)

15.62

(13)

GFI 0.96 0.90

AGFI 0.87 0.88

兩個模型的 performance相當，基於 parsimony原則，故選擇限制模型。

58

考量其他不同簡單結構以外的衡量方法

6.4.3 簡單因子結構之外的變化 (P.193)

59

例題 : 連鎖商店 (p.194)

Menezes and Elber(1979)使用多重衡量方法，李克尺度 (Likert Scale)、語意差異尺度 (Semantic differential Scale)、史德培尺度 (Stapel Scale)評估連鎖商店的商店外觀 (store appearance)與產品多樣化(product assortment)特徵，樣本來源為 250位夜校學生。

樣本量： 250

指標變數： AL、 AD、 AS、 PL、 PD、 PS

潛伏變數： store appearance、 product assortment

60

路徑圖：連鎖商店 -Simple Model (P.194)

appearance

AL


assortment

AD AS PL PD PS

δ1 δ2 δ3 δ4 δ5 δ6

61

Title Confirmatory Factor Analysis for Store Grocery- Simple modelObserved Variables AL AD AS PL PD PSCorrelation Matrix= 1.000 0.776 1.000 0.676 0.739 1.000 0.638 0.600 0.539 1.000 0.561 0.635 0.527 0.713 1.000 0.522 0.559 0.589 0.720 0.698 1.000Sample Size=250Latent Variables APPEARANCE PRODUCTRelationships: AL=APPEARANCE AD=APPEARANCE AS=APPEARANCE PL=PRODUCT PD=PRODUCT PS=PRODUCTPath DiagramLISREL OUTPUT SE TV RS MI

相關矩陣

指標變數

潛伏變數



軟體操作 :連鎖商店 -Simple Model

62

軟體操作 :連鎖商店 - Simple Model (P.195)

63


兩潛伏變數之間的相關性

軟體操作 :連鎖商店 -Simple Model (P.195)

64


卡方值

近似標準殘差矩陣Asymptotically Standardized

Residual Matrix

軟體操作 :連鎖商店 - Simple Model (P.195)

GFI (good)、AGFI (acceptable)

65

採用 (multitrait, multimethed model,MTMM) 多重特質多重方法，以測量理論架構的效度。

收歛效度 (convergent validity)：對相同特性使用不同衡量方法，所得結果高度相關。

區別效度 (discriminant)：不同構面彼此之間確實不相同。 (不完全相關 )

例題 :連鎖商店 -Method Factors (P.194)

66

11 12 42 13 43,corr AL PL

11 1 13 3 1

42 2 43 3 4

AL

PL

13 43 .3

24 54 .4

35 65 .5

67

11 .3

21 .4

31 .5

42 .3

52 .4

62 .5

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0

68

路徑圖：連鎖商店 -Method Factors(P.197)

appearance

AL


product

AD AS PL PD PS

Semantic differential

StapelLikert

(參 p.194)考量方法因素，使用相同尺度衡量不同因素。

69

軟體操作 :連鎖商店 -Method Factors (P.196)

相關矩陣

增加三個潛伏變數

定義指標變數與潛伏變數的關係

定義潛伏變數之間的關係

70


新增部分參數最大

概似估計殘差項係數

71


額外增加三種衡量尺度的參數最大概似估計

參數最大概似估計

兩潛伏變數之間的關係

72


殘差變異數估計

卡方值、自由度

GFI、 AGFI、 RMR

73

在 Simple Model中，未考量殘差之間的相關性，現在我們加入殘差項之間的共變性，加以研究。

例題 : 連鎖商店 -Correlated Error (P.197)

參考P.197

74

211 14

222 25

233 36

241 44

252 55

263 66

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

75

路徑圖：連鎖商店 - Correlated Error (P.198)

appearance

AL

product

AD AS PL PD PS

考量誤差項

加入殘差項之間的共變性

δ1 δ2 δ3 δ4 δ5 δ6

76

軟體操作 :連鎖商店 - Correlated Error

Title EX1: Confirmatory Factor Analysis for grocery store-correlated errorObserved Variables AL AD AS PL PD PS Correlation Matrix= 1.000 0.776 1.000 0.676 0.739 1.000 0.638 0.600 0.539 1.000 0.561 0.635 0.527 0.713 1.000 0.522 0.559 0.589 0.720 0.698 1.000Sample Size=250Latent Variables APPEARANCE PRODUCTRelationships: AL=APPEARANCE AD=APPEARANCE AS=APPEARANCE PL=PRODUCT PD=PRODUCT PS=PRODUCTSET the errors between AL and PL correlateSET the errors between AD and PD correlateSET the errors between AS and PS correlate Path DiagramLISREL OUTPUT SE TV RS MI

相關矩陣

對潛在變數進行標籤

定義指標變數與潛伏變數的關係

定義殘差的關係

77

軟體操作 :連鎖商店 - Correlated Error (P.195)

新增誤差項部分

參數最大概似估計

殘差項係數

78



兩潛伏變數之間的關係

79


誤差變異數估計、標準誤、 t值

卡方值


80


GFI(good)、 AGFI(good)、 RMR

81

實地演練

82

~ The End ~

1 Confirmatory Factor Analysis 第六章驗證型因素分析. 2 大綱＊ 6.1 前言＊ 6.2...

Documents

Transcript of 1 Confirmatory Factor Analysis 第六章驗證型因素分析. 2 大綱＊ 6.1 前言＊ 6.2...

1 Confirmatory Factor Analysis 第六章 驗證型因素分析. 2 大綱 ＊ 6.1 前言 ＊ 6.2...

Documents

Transcript of 1 Confirmatory Factor Analysis 第六章 驗證型因素分析. 2 大綱 ＊ 6.1 前言 ＊ 6.2...

1 Confirmatory Factor Analysis 第六章驗證型因素分析. 2 大綱＊ 6.1 前言＊ 6.2...

Transcript of 1 Confirmatory Factor Analysis 第六章驗證型因素分析. 2 大綱＊ 6.1 前言＊ 6.2...