Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Metodologie Quantitative Analisi Fattoriale M Q -...
Transcript of Metodologie Quantitative Analisi Fattoriale M Q -...
1
M
Q
Metodologie Quantitative
Analisi Fattoriale
La scelta del numero di fattori
Marco Perugini
Milano-Bicocca
Lezione: XI
2
I passaggi fondamentali
1) Scelta del modello fattoriale
2) Scelta del numero di fattori
3) Rotazione della struttura fattoriale
4) Selezione delle variabili
5) Interpretazione dei fattori
6) Punteggi fattoriali
Lezione: XI
3
Decidere il numero di fattori
Lezione: XI
Esistono diversi metodi per decidere quanti fattori/componenti tenere
Non esiste un criterio “oggettivo” (ad es., algoritmo) che determina in
maniera inequivocabile ed assoluta il numero dei fattori da scegliere
Perché?
I fattori rappresentano un modello della realtà e diversi modelli possono
essere plausibili
Alcuni sono più plausibili, altri sono meno plausibili, ed altri ancora
sono non plausibili
C’è un elemento soggettivo nella decisione
Soggettivo NON significa arbitrario
4
Metodi principali
Lezione: XI
Autovalore maggiore di 1 (Kaiser-Guttman, mineigen)
Scree-Test (Cattell)
Stabilità (Everett)
Analisi Parallela (Horn)
Goodness-of-fit Test (per AFC, ML)
Scomposizione soluzioni fattoriali
Interpretabilità dei fattori
Non c’è nulla di meglio di una buona teoria alle spalle…
Metodi più avanzati
Metodi più teorici (dopo ultima lezione sui concetti di base)
Metodi più semplici
5
Metodi peggiori:
Lezione: XI
Percentuale di varianza spiegata (si focalizza sulla % minima di
varianza che ogni fattore / componente dovrebbe estrarre, oppure sulla
varianza minima che dovrebbe essere complessivamente spiegata):
- completamente a-teorico
- valori arbitrari
a) Massima correlazione residua
(non estrarre nuovi fattori se tutti i residui sono minori di |.10|)
b) Maximum likelihood (Goodness of fit test):
- focalizzati sul cercare di spiegare il più possibile piuttosto che sul
definire un modello teorico affidabile, robusto, o interpretabile
- suggeriscono una soluzione fattoriale tale che R* sia non
significativamente diversa da R
- suggerirebbero un numero di fattori elevato
- estremamente sensibile alla numerosità campionaria
6
Criterio Mineigen (Autovalore > 1)
Lezione: XI
Ricordiamo che autovalore = varianza spiegata dal fattore
Varianza totale spiegata
1.235 41.177 41.177 1.235 41.177 41.177
.932 31.072 72.249 .932 31.072 72.249
.833 27.751 100.000 .833 27.751 100.000
Componente1
2
3
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di estrazione: Analis i componenti princ ipali.
Ogni variabile spiega se stessa, dunque spiega 1 (variabili standardizzate)
Dunque un fattore che spiega meno di 1, spiega meno di una variabile
Usare fattori che spiegano meno di 1 non è efficiente (sarebbe più efficiente
usare una variabile osservata)
Criterio detto Mineigen o di Kaiser-Guttman
7
Esempi
Lezione: XI
8
Esempi
Lezione: XI
Varianza totale spiegata
2.419 16.125 16.125 2.419 16.125 16.125
1.948 12.986 29.111 1.948 12.986 29.111
1.279 8.530 37.641 1.279 8.530 37.641
1.085 7.236 44.877 1.085 7.236 44.877
1.027 6.845 51.722 1.027 6.845 51.722
.958 6.385 58.107 .958 6.385 58.107
.886 5.905 64.012 .886 5.905 64.012
.849 5.663 69.675 .849 5.663 69.675
.820 5.467 75.143 .820 5.467 75.143
.724 4.824 79.967 .724 4.824 79.967
.670 4.464 84.431 .670 4.464 84.431
.646 4.306 88.737 .646 4.306 88.737
.593 3.955 92.692 .593 3.955 92.692
.579 3.859 96.551 .579 3.859 96.551
.517 3.449 100.000 .517 3.449 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di estrazione: Analis i componenti princ ipali.
9
Esempi
Lezione: XI
Varianza totale spiegata
12.470 12.470 12.470 12.470 12.470 12.470
9.019 9.019 21.489 9.019 9.019 21.489
5.831 5.831 27.320 5.831 5.831 27.320
4.981 4.981 32.301 4.981 4.981 32.301
3.912 3.912 36.213 3.912 3.912 36.213
2.281 2.281 38.494 2.281 2.281 38.494
2.135 2.135 40.629 2.135 2.135 40.629
1.918 1.918 42.547 1.918 1.918 42.547
1.906 1.906 44.453 1.906 1.906 44.453
1.744 1.744 46.197 1.744 1.744 46.197
1.721 1.721 47.917 1.721 1.721 47.917
1.640 1.640 49.557 1.640 1.640 49.557
1.620 1.620 51.178 1.620 1.620 51.178
1.499 1.499 52.677 1.499 1.499 52.677
1.456 1.456 54.133 1.456 1.456 54.133
1.344 1.344 55.477 1.344 1.344 55.477
1.330 1.330 56.806 1.330 1.330 56.806
1.295 1.295 58.102 1.295 1.295 58.102
1.269 1.269 59.371 1.269 1.269 59.371
1.225 1.225 60.595 1.225 1.225 60.595
1.177 1.177 61.773 1.177 1.177 61.773
1.155 1.155 62.928 1.155 1.155 62.928
1.139 1.139 64.067 1.139 1.139 64.067
1.094 1.094 65.161 1.094 1.094 65.161
1.048 1.048 66.209 1.048 1.048 66.209
1.041 1.041 67.250 1.041 1.041 67.250
1.022 1.022 68.273 1.022 1.022 68.273
1.004 1.004 69.276 1.004 1.004 69.276
.973 .973 70.250
.953 .953 71.202
.921 .921 72.124
.901 .901 73.025
.876 .876 73.901
.851 .851 74.751
.822 .822 75.573
.789 .789 76.363
.765 .765 77.128
.743 .743 77.872
.719 .719 78.591
.695 .695 79.286
.685 .685 79.971
.677 .677 80.648
.665 .665 81.313
.647 .647 81.960
.646 .646 82.606
.628 .628 83.234
.611 .611 83.845
.596 .596 84.441
.576 .576 85.017
.552 .552 85.569
.544 .544 86.113
.528 .528 86.640
.509 .509 87.150
.493 .493 87.643
.484 .484 88.127
.469 .469 88.596
.460 .460 89.055
.455 .455 89.510
.435 .435 89.945
.423 .423 90.369
.409 .409 90.778
.402 .402 91.180
.389 .389 91.569
.386 .386 91.956
.371 .371 92.326
.366 .366 92.693
.365 .365 93.057
.352 .352 93.409
.341 .341 93.750
.331 .331 94.082
.316 .316 94.398
.310 .310 94.708
.300 .300 95.008
.293 .293 95.301
.281 .281 95.583
.268 .268 95.850
.259 .259 96.109
.255 .255 96.364
.249 .249 96.613
.242 .242 96.855
.235 .235 97.091
.227 .227 97.318
.216 .216 97.534
.209 .209 97.743
.201 .201 97.944
.198 .198 98.142
.191 .191 98.333
.182 .182 98.515
.179 .179 98.694
.169 .169 98.863
.161 .161 99.024
.146 .146 99.170
.141 .141 99.312
.136 .136 99.447
.128 .128 99.575
.120 .120 99.695
.111 .111 99.806
.099 .099 99.905
.095 .095 100.000
-2.22E-16 -2.220E-16 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
10
Problemi
Lezione: XI
Tende a sovrastimare il numero di fattori (tipicamente intorno ad 1/3
delle variabili)
E’ più utile considerarlo come indicatore del numero massimo di
fattori da considerare (con buon senso…)
Qual è la differenza tra un autovalore di 1.01 ed uno di 0.99?
(ma questo vale per qualsiasi soglia)
E’ l’opzione di default di SPSS
eppure è il criterio più debole tra quello che considereremo
sconsigliato
11
Scree-test
Lezione: XI
I fattori sono estratti in sequenza, secondo la loro capacità di spiegare
varianza
Varianza totale spiegata
2.419 16.125 16.125 2.419 16.125 16.125
1.948 12.986 29.111 1.948 12.986 29.111
1.279 8.530 37.641 1.279 8.530 37.641
1.085 7.236 44.877 1.085 7.236 44.877
1.027 6.845 51.722 1.027 6.845 51.722
.958 6.385 58.107 .958 6.385 58.107
.886 5.905 64.012 .886 5.905 64.012
.849 5.663 69.675 .849 5.663 69.675
.820 5.467 75.143 .820 5.467 75.143
.724 4.824 79.967 .724 4.824 79.967
.670 4.464 84.431 .670 4.464 84.431
.646 4.306 88.737 .646 4.306 88.737
.593 3.955 92.692 .593 3.955 92.692
.579 3.859 96.551 .579 3.859 96.551
.517 3.449 100.000 .517 3.449 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di estrazione: Analis i componenti princ ipali.
Vi sarà un punto in questa sequenza dopo il quale aggiungere fattori non cambia molto la
capacità di spiegare varianza
12
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Numero componente
0.5
1.0
1.5
2.0
2.5
Au
tov
alo
re
Grafico decrescente degli autovalori
Scree-test
Lezione: XI
Attraverso il grafico degli autovalori, è possibile stimare tale punto
Quale è quel punto (numero di fattori) oltre il quale i fattori
iniziano a spiegare di più degli altri?
Tracciamo una retta partendo dagli autovalori più bassi
13
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Numero componente
0.5
1.0
1.5
2.0
2.5
Au
tov
alo
re
Grafico decrescente degli autovalori
Scree-test
Lezione: XI
I fattori “sopra” a questa retta spiegano una quota più
importante di varianza rispetto a quelli sulla retta
Teniamo 3 componenti
Tracciamo una retta partendo dagli autovalori più bassi
Attraverso il grafico degli autovalori, è possibile stimare tale punto
14
Scree-test e Autovalore>1
Lezione: XI
Con gli stessi dati, il criterio Autovalore>1 suggerisce la presenza di 5
componenti
Varianza totale spiegata
2.419 16.125 16.125 2.419 16.125 16.125
1.948 12.986 29.111 1.948 12.986 29.111
1.279 8.530 37.641 1.279 8.530 37.641
1.085 7.236 44.877 1.085 7.236 44.877
1.027 6.845 51.722 1.027 6.845 51.722
.958 6.385 58.107 .958 6.385 58.107
.886 5.905 64.012 .886 5.905 64.012
.849 5.663 69.675 .849 5.663 69.675
.820 5.467 75.143 .820 5.467 75.143
.724 4.824 79.967 .724 4.824 79.967
.670 4.464 84.431 .670 4.464 84.431
.646 4.306 88.737 .646 4.306 88.737
.593 3.955 92.692 .593 3.955 92.692
.579 3.859 96.551 .579 3.859 96.551
.517 3.449 100.000 .517 3.449 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di estrazione: Analis i componenti princ ipali.
Il criterio scree-test è preferibile, purchè i fattori tenuti abbiano autovalori>1
15
Un altro esempio
Lezione: XI
PCA su 10 item
Varianza totale spiegata
2.520 25.197 25.197 2.520 25.197 25.197
1.486 14.859 40.057 1.486 14.859 40.057
.959 9.591 49.648 .959 9.591 49.648
.894 8.938 58.586 .894 8.938 58.586
.804 8.043 66.629 .804 8.043 66.629
.768 7.675 74.304 .768 7.675 74.304
.741 7.411 81.715 .741 7.411 81.715
.696 6.956 88.670 .696 6.956 88.670
.575 5.748 94.418 .575 5.748 94.418
.558 5.582 100.000 .558 5.582 100.000
Componente1
2
3
4
5
6
7
8
9
10
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
Il criterio Mineigen suggerisce la presenza di 2 componenti
16
1 2 3 4 5 6 7 8 9 10
Numero componente
0.5
1.0
1.5
2.0
2.5
3.0
Au
tov
alo
re
Grafico decrescente degli autovalori
Lezione: XI
Tracciamo una retta partendo dagli autovalori più bassi
Teniamo i fattori sopra tale retta
anche scree test suggerisce 2 componenti.
17
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Numero componente
0.5
1.0
1.5
2.0
2.5
Au
tov
alo
re
Grafico decrescente degli autovalori
Scree-test
Lezione: XI
Salto degli autovalori
Il salto degli autovalori (differenza tra autovalori
successivi) riflette numericamente lo scree-test
18
Esempio
Lezione: XI
Varianza totale spiegata
5.814 29.070 29.070 5.814 29.070 29.070
3.387 16.934 46.004 3.387 16.934 46.004
1.909 9.543 55.547 1.909 9.543 55.547
1.233 6.164 61.711 1.233 6.164 61.711
1.109 5.547 67.258 1.109 5.547 67.258
.845 4.226 71.484
.734 3.668 75.152
.675 3.373 78.525
.658 3.292 81.817
.575 2.877 84.694
.486 2.431 87.125
.423 2.115 89.240
.391 1.956 91.196
.338 1.690 92.886
.310 1.552 94.438
.273 1.366 95.804
.252 1.260 97.065
.224 1.121 98.186
.199 .996 99.182
.164 .818 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
19
Corrispondenza tra salto degli autovalori e scree-test
Lezione: XI
Varianza totale spiegata
ComponenteAutovalori iniziali
Differenza autovalori Totale % di varianza% cumulata
(5.814-3.387)= 1 5.814 29.070 29.070
(1-2) 2.427 2 3.387 16.934 46.004
(2-3) 1.478 3 1.909 9.543 55.547
(3-4) 0.676 4 1.233 6.164 61.711
(4-5) 0.123 5 1.109 5.547 67.258
(5-6) 0.264 6 0.845 4.226 71.484
(6-7) 0.112 7 0.734 3.668 75.152
(7-8) 0.059 8 0.675 3.373 78.525
(8-9) 0.016 9 0.658 3.292 81.817
(9-10) 0.083 10 0.575 2.877 84.694
(10-11) 0.089 11 0.486 2.431 87.125
(11-12) 0.063 12 0.423 2.115 89.240
(12-13) 0.032 13 0.391 1.956 91.196
(13-14) 0.053 14 0.338 1.690 92.886
(14-15) 0.028 15 0.310 1.552 94.438
(15-16) 0.037 16 0.273 1.366 95.804
(16-17) 0.021 17 0.252 1.260 97.065
(17-18) 0.028 18 0.224 1.121 98.186
(18-19) 0.025 19 0.199 0.996 99.182
(19-20) 0.036 20 0.164 0.818 100.000
Metodo di estrazione: Analisi componenti principali.
20
Corrispondenza tra salto degli autovalori e scree-test
Lezione: XI
Salto degli autovalori
0.000
0.500
1.000
1.500
2.000
2.500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
(A_n - A_n+1)
Dif
f. A
uto
v
21
Esempi: 1
Lezione: XI
Varianza totale spiegata
12.470 12.470 12.470 12.470 12.470 12.470
9.019 9.019 21.489 9.019 9.019 21.489
5.831 5.831 27.320 5.831 5.831 27.320
4.981 4.981 32.301 4.981 4.981 32.301
3.912 3.912 36.213 3.912 3.912 36.213
2.281 2.281 38.494 2.281 2.281 38.494
2.135 2.135 40.629 2.135 2.135 40.629
1.918 1.918 42.547 1.918 1.918 42.547
1.906 1.906 44.453 1.906 1.906 44.453
1.744 1.744 46.197 1.744 1.744 46.197
1.721 1.721 47.917 1.721 1.721 47.917
1.640 1.640 49.557 1.640 1.640 49.557
1.620 1.620 51.178 1.620 1.620 51.178
1.499 1.499 52.677 1.499 1.499 52.677
1.456 1.456 54.133 1.456 1.456 54.133
1.344 1.344 55.477 1.344 1.344 55.477
1.330 1.330 56.806 1.330 1.330 56.806
1.295 1.295 58.102 1.295 1.295 58.102
1.269 1.269 59.371 1.269 1.269 59.371
1.225 1.225 60.595 1.225 1.225 60.595
1.177 1.177 61.773 1.177 1.177 61.773
1.155 1.155 62.928 1.155 1.155 62.928
1.139 1.139 64.067 1.139 1.139 64.067
1.094 1.094 65.161 1.094 1.094 65.161
1.048 1.048 66.209 1.048 1.048 66.209
1.041 1.041 67.250 1.041 1.041 67.250
1.022 1.022 68.273 1.022 1.022 68.273
1.004 1.004 69.276 1.004 1.004 69.276
.973 .973 70.250
.953 .953 71.202
.921 .921 72.124
.901 .901 73.025
.876 .876 73.901
.851 .851 74.751
.822 .822 75.573
.789 .789 76.363
.765 .765 77.128
.743 .743 77.872
.719 .719 78.591
.695 .695 79.286
.685 .685 79.971
.677 .677 80.648
.665 .665 81.313
.647 .647 81.960
.646 .646 82.606
.628 .628 83.234
.611 .611 83.845
.596 .596 84.441
.576 .576 85.017
.552 .552 85.569
.544 .544 86.113
.528 .528 86.640
.509 .509 87.150
.493 .493 87.643
.484 .484 88.127
.469 .469 88.596
.460 .460 89.055
.455 .455 89.510
.435 .435 89.945
.423 .423 90.369
.409 .409 90.778
.402 .402 91.180
.389 .389 91.569
.386 .386 91.956
.371 .371 92.326
.366 .366 92.693
.365 .365 93.057
.352 .352 93.409
.341 .341 93.750
.331 .331 94.082
.316 .316 94.398
.310 .310 94.708
.300 .300 95.008
.293 .293 95.301
.281 .281 95.583
.268 .268 95.850
.259 .259 96.109
.255 .255 96.364
.249 .249 96.613
.242 .242 96.855
.235 .235 97.091
.227 .227 97.318
.216 .216 97.534
.209 .209 97.743
.201 .201 97.944
.198 .198 98.142
.191 .191 98.333
.182 .182 98.515
.179 .179 98.694
.169 .169 98.863
.161 .161 99.024
.146 .146 99.170
.141 .141 99.312
.136 .136 99.447
.128 .128 99.575
.120 .120 99.695
.111 .111 99.806
.099 .099 99.905
.095 .095 100.000
-2.22E-16 -2.220E-16 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
22
Esempi
Lezione: XI
1 4 7 10 13 16 1922 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
Numero componente
0
2
4
6
8
10
12
Aut
oval
ore
Grafico decrescente degli autovalori
23
Esempi
Lezione: XI
Grafico salto degli autovalori
0.000
0.500
1.000
1.500
2.000
2.500
3.000
3.500
4.000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
1-2
2-3
3-4
4-5
5-6
6-7
24
Esempi - 2
Lezione: XI
Varianza totale spiegata
13.598 13.598 13.598 13.598 13.598 13.598
10.065 10.065 23.662 10.065 10.065 23.662
5.512 5.512 29.174 5.512 5.512 29.174
5.001 5.001 34.175 5.001 5.001 34.175
4.915 4.915 39.091 4.915 4.915 39.091
3.573 3.573 42.664 3.573 3.573 42.664
1.950 1.950 44.614 1.950 1.950 44.614
1.939 1.939 46.552 1.939 1.939 46.552
1.824 1.824 48.377 1.824 1.824 48.377
1.761 1.761 50.138 1.761 1.761 50.138
1.620 1.620 51.758 1.620 1.620 51.758
1.574 1.574 53.331 1.574 1.574 53.331
1.525 1.525 54.856 1.525 1.525 54.856
1.455 1.455 56.311 1.455 1.455 56.311
1.393 1.393 57.704 1.393 1.393 57.704
1.316 1.316 59.020 1.316 1.316 59.020
1.272 1.272 60.292 1.272 1.272 60.292
1.203 1.203 61.495 1.203 1.203 61.495
1.187 1.187 62.682 1.187 1.187 62.682
1.141 1.141 63.822 1.141 1.141 63.822
1.122 1.122 64.945 1.122 1.122 64.945
1.099 1.099 66.044 1.099 1.099 66.044
1.055 1.055 67.099 1.055 1.055 67.099
1.006 1.006 68.105 1.006 1.006 68.105
.978 .978 69.083
.951 .951 70.034
.932 .932 70.967
.925 .925 71.892
.909 .909 72.800
.864 .864 73.665
.833 .833 74.498
.823 .823 75.321
.795 .795 76.115
.773 .773 76.889
.758 .758 77.646
.731 .731 78.378
.715 .715 79.092
.702 .702 79.794
.668 .668 80.462
.651 .651 81.113
.640 .640 81.752
.628 .628 82.380
.595 .595 82.974
.570 .570 83.544
.565 .565 84.109
.549 .549 84.659
.545 .545 85.204
.534 .534 85.738
.522 .522 86.260
.512 .512 86.773
.501 .501 87.274
.472 .472 87.746
.467 .467 88.214
.456 .456 88.669
.445 .445 89.114
.432 .432 89.546
.422 .422 89.968
.403 .403 90.371
.399 .399 90.770
.382 .382 91.151
.377 .377 91.528
.361 .361 91.889
.352 .352 92.241
.344 .344 92.585
.331 .331 92.917
.326 .326 93.243
.323 .323 93.566
.317 .317 93.883
.315 .315 94.198
.299 .299 94.497
.291 .291 94.788
.279 .279 95.067
.275 .275 95.342
.263 .263 95.605
.257 .257 95.862
.249 .249 96.111
.240 .240 96.352
.235 .235 96.587
.227 .227 96.814
.225 .225 97.038
.212 .212 97.250
.203 .203 97.453
.203 .203 97.656
.195 .195 97.851
.188 .188 98.038
.176 .176 98.215
.173 .173 98.388
.165 .165 98.553
.157 .157 98.710
.153 .153 98.863
.148 .148 99.011
.137 .137 99.149
.132 .132 99.280
.126 .126 99.406
.114 .114 99.520
.107 .107 99.627
.102 .102 99.729
.098 .098 99.827
.090 .090 99.917
.083 .083 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
25
Esempi
Lezione: XI
1 4 7 10 13 16 1922 25 28 31 34 3740 43 46 49 52 55 5861 64 67 70 73 76 7982 85 88 91 94 97 100
Numero componente
0
2
4
6
8
10
12
14
Au
tova
lore
Grafico decrescente degli autovalori
26
0.000
0.500
1.000
1.500
2.000
2.500
3.000
3.500
4.000
4.500
5.000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Esempi
Lezione: XI
Grafico salto degli autovalori
1-2
2-3
3-4
4-5
5-6
6-7
7-8
27
Esempi - 3
Lezione: XI
Varianza totale spiegata
6.703 20.946 20.946 6.703 20.946 20.946
2.954 9.232 30.178 2.954 9.232 30.178
2.090 6.533 36.711 2.090 6.533 36.711
1.746 5.458 42.169 1.746 5.458 42.169
1.450 4.532 46.701 1.450 4.532 46.701
1.201 3.753 50.454 1.201 3.753 50.454
1.100 3.438 53.892 1.100 3.438 53.892
1.097 3.429 57.321 1.097 3.429 57.321
1.030 3.219 60.540 1.030 3.219 60.540
1.013 3.164 63.704 1.013 3.164 63.704
.941 2.942 66.645
.888 2.774 69.419
.809 2.529 71.948
.758 2.370 74.318
.757 2.367 76.686
.712 2.227 78.912
.691 2.159 81.071
.625 1.953 83.025
.567 1.771 84.796
.563 1.759 86.555
.553 1.728 88.283
.512 1.599 89.882
.478 1.495 91.377
.423 1.323 92.699
.382 1.193 93.892
.359 1.122 95.014
.323 1.009 96.023
.288 .901 96.924
.283 .883 97.808
.260 .813 98.620
.227 .709 99.329
.215 .671 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
28
Esempi
Lezione: XI
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
20 21 22 23 24 25 26 27 28 29 30 31 32
Numero componente
0
1
2
3
4
5
6
7
Au
tova
lore
Grafico decrescente degli autovalori
29
0.000
0.500
1.000
1.500
2.000
2.500
3.000
3.500
4.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Esempi
Lezione: XI
Grafico salto degli autovalori
1-2
2-3
3-4
4-5 5-6 6-7
30
Esempi - 4
Lezione: XI
Varianza totale spiegata
7.366 14.442 14.442 7.366 14.442 14.442
4.077 7.994 22.436 4.077 7.994 22.436
3.311 6.493 28.929 3.311 6.493 28.929
1.823 3.575 32.504 1.823 3.575 32.504
1.743 3.418 35.921 1.743 3.418 35.921
1.406 2.756 38.677 1.406 2.756 38.677
1.288 2.525 41.202 1.288 2.525 41.202
1.244 2.440 43.642 1.244 2.440 43.642
1.183 2.320 45.962 1.183 2.320 45.962
1.116 2.188 48.150 1.116 2.188 48.150
1.108 2.172 50.322 1.108 2.172 50.322
1.042 2.044 52.366 1.042 2.044 52.366
1.011 1.983 54.349 1.011 1.983 54.349
.971 1.904 56.253
.930 1.824 58.077
.903 1.772 59.848
.890 1.745 61.593
.845 1.657 63.251
.835 1.638 64.888
.821 1.610 66.498
.780 1.530 68.028
.776 1.521 69.550
.763 1.495 71.045
.752 1.474 72.519
.723 1.417 73.937
.699 1.371 75.307
.680 1.333 76.640
.663 1.299 77.939
.649 1.272 79.212
.630 1.236 80.448
.617 1.209 81.657
.588 1.153 82.809
.584 1.145 83.955
.576 1.130 85.085
.570 1.117 86.202
.561 1.101 87.303
.534 1.048 88.350
.514 1.008 89.359
.507 .995 90.353
.487 .955 91.308
.474 .930 92.239
.457 .896 93.135
.443 .869 94.003
.434 .852 94.855
.424 .831 95.686
.403 .789 96.475
.381 .747 97.222
.373 .731 97.953
.360 .706 98.659
.344 .674 99.333
.340 .667 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
31
Esempi
Lezione: XI
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51
Numero componente
0
2
4
6
8
Aut
oval
ore
Grafico decrescente degli autovalori
32
0.000
0.500
1.000
1.500
2.000
2.500
3.000
3.500
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Esempi
Lezione: XI
Grafico salto degli autovalori
1-2
2-3
3-4
4-5
5-6 6-7
33
Scree-test
Lezione: XI
Migliore tra i metodi semplici
Necessita di esperienza, buon occhio e conoscenza teorica
Meglio se usato insieme a considerazioni teoriche
Meglio se usato riferendosi ai valori numerici e non solo al grafico
Focus sul cambiamento di pendenza (salto degli autovalori)
Tende a suggerire un numero corretto di fattori
Logica: i raggruppamenti principali tendono ad emergere in maniera
distinta dai raggruppamenti secondari
I raggruppamenti principali tendono ad essere più affidabili
34
Scree-test
Lezione: XI
Problemi
• Metodo soggettivo
• Può indicare più soluzioni plausibili
• Necessita di esperienza, buon occhio e conoscenza teorica
• Indicazioni chiare sono meno probabili con campioni piccoli e con un
rapporto più basso tra variabili e fattori estratti
35
Stabilità (Everett, 1983)
Lezione: XI
Proprietà desiderabile della soluzione fattoriale:
la soluzione fattoriale prescelta deve essere stabile
Ossia: I fattori estratti devono essere replicabili su campioni diversi da
quelli nei quali sono stati individuati.
Condizione minima di stabilità:
la soluzione deve essere stabile nel campione
36
Stabilità (Everett)
Lezione: XI
I fattori “validi” sono quelli che emergeranno in studi diversi con campioni
diversi
I fattori “non validi” sono quelli che emergono in uno studio ma non in un
altro
I fattori “non validi” saranno determinati in maniera sostanziale dall’errore
campionario (fluttuazione casuale tra uno studio e l’altro)
Noi abbiamo un solo campione. Lo utilizziamo per verificare la stabilità dei
fattori al suo interno.
Una soluzione che non è stabile all’interno di un campione, non sarà stabile
considerando diversi campioni
Una soluzione che è stabile all’interno di un campione è una buona candidata
per essere stabile in generale
37
Stabilita’ (Everett)
Lezione: XI
SPSS non prevede questo metodo, ma lo si può implementare con delle routine
specializzate (linguaggio sintassi SPSS)
La logica:
1. Si divide il campione in due sottocampioni casuali, ricavando così due
matrici di dati standardizzati (ZA e ZB)
2. Si compie l’analisi fattoriale (con la rotazione) separatamente sui due
sottocampioni e si salvano i coefficienti dei punteggi fattoriali specifici
(BA e BB)
3. Si utilizzano i coefficienti fattoriali specifici ai due campioni per
calcolare su tutti i soggetti (campione completo) i punteggi nei fattori
(cioe’ FA=ZBA e Fb=ZBB)
4. Si calcola la correlazione tra i punteggi nei fattori così calcolati
38
Stabilità (Everett)
Lezione: XI
5. l numero di fattori che si estraggono è quello del numero
massimo sensato di fattori che si potrebbero considerare
6. Si considerano stabili quei fattori che correlano al di sopra di .90
(criterio stringente) o di .85 (criterio minimo)
7. Vengono estratti solo i fattori che sono stabili: viene eseguita
una nuova analisi fattoriale su tutto il campione selezionando il
numero di fattori che sono stati riscontrati come stabili
39
Esempio
Lezione: XI
Coefficienti di
Stabilità
.9887 -.075
.2554 .9620
2 fattori
Coefficienti di Stabilità
.9887 -.075 -.241
.2554 .9620 -.015
-.083 .0715 .9770
3 fattori
Coefficienti di Stabilità
.9887 -.075 -.241 .0765
.2554 .9620 -.015 -.264
-.083 .0715 .9770 .1085
.0429 -.040 -.169 .3987
4 fattori
Coefficienti di Stabilità
.9887 -.075 -.241 .0765 .0446
.2554 .9620 -.015 -.264 .1067
-.083 .0715 .9770 .1085 .0554
.0429 -.040 -.169 .3987 .7349
.0407 .1457 -.080 .7502 -.478
5 fattori
Coefficienti di Stabilità
.9887 -.075 -.241 .0765 .0446 .0519
.2554 .9620 -.015 -.264 .1067 -.066
-.083 .0715 .9770 .1085 .0554 .0837
.0429 -.040 -.169 .3987 .7349 .0059
.0407 .1457 -.080 .7502 -.478 .1029
.0704 -.116 -.100 .2006 .0091 .5895
6 fattori
Si considerano solo i valori diagonali
40
Stabilità (Everett)
Lezione: XI
Buon criterio di scelta
Premia i fattori che sono stabili nel campione
Proprietà molto importante
Non molto diffuso, ma facile da applicare in SPSS
Molto utile anche per testare la stabilità tra campioni diversi e tra
metodi diversi
41
Analisi parallela (Horn, 1965)
Lezione: XI
Proprietà desiderabile:
la soluzione fattoriale prescelta deve essere non casuale (random)
Non vogliamo considerare dei fattori che emergono casualmente
Vogliamo considerare fattori che sono “validi”
Condizione minima di validità:
i fattori devono spiegare più varianza rispetto a fattori costruiti in
modo casuale a partire dai dati disponibili
La logica: Non siamo interessati a considerare un fattore che spiega
meno varianza di un fattore emerso casualmente
42
Analisi parallela (Horn, 1965)
Lezione: XI
SPSS non prevede questo metodo (si può implementare con il linguaggio sintassi)
La procedura:
1. Generare dati casuali con stesso numero di soggetti e variabili dei dati veri
2. Estrarre gli autovalori dalla matrice di dati generati casualmente
3. Ripetere le operazioni (1) – (2) almeno 100 volte, registrando ogni volta gli
autovalori di tutti i fattori estratti
4. Calcolare autovalori medi e 95° percentile per tutti i fattori estratti
5. Condurre l’analisi fattoriale sui dati veri
6. Confrontare gli autovalori dei dati casuali e quelli dei dati veri
7. Scegliere i fattori che spiegano più varianza del fattore corrispondente estratto
dai dati casuali (usando la media o il 95° percentile)
8. Condurre l’analisi fattoriale estraendo il numero di fattori così identificato
Routine anche disponibile online a http://smishra.faculty.ku.edu/parallelengine.htm
43
Esempio - Scree test?
Lezione: XI
1 3 5 7 9 11 13 15 17 19
21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51
Numero componente
0
2
4
6
8
Au
tova
lore
Grafico decrescente degli autovalori
44
Esempio – Mineigen ?
Lezione: XI
45
Esempio –
Analisi
Parallela?
Lezione: XI
PARALLEL ANALYSIS:Principal Components
Specifications for this Run:
Ncases 875; Nvars 51; Ndatsets 100; Percent 95
Random Data Eigenvalues
Root Means Prcntyle
1.000000 1.495933 1.534748
2.000000 1.449547 1.483834
3.000000 1.413240 1.444165
4.000000 1.383953 1.414128
5.000000 1.357437 1.384085
6.000000 1.331171 1.350236
7.000000 1.308793 1.330356
8.000000 1.287407 1.311233
9.000000 1.267480 1.281856
10.000000 1.247886 1.263203
11.000000 1.228760 1.244180
12.000000 1.210060 1.227170
13.000000 1.190141 1.205910
14.000000 1.172808 1.187282
15.000000 1.155679 1.169908
16.000000 1.138982 1.154476
17.000000 1.121598 1.139739
18.000000 1.104409 1.120724
19.000000 1.089430 1.105355
20.000000 1.072517 1.084520
21.000000 1.056629 1.071671
22.000000 1.040796 1.054376
23.000000 1.026061 1.042472
24.000000 1.011205 1.029739
25.000000 .996531 1.011536
26.000000 .981428 .996269
27.000000 .966140 .982166
28.000000 .952238 .965512
29.000000 .938232 .954188
30.000000 .924154 .936506
46
Esempio – analisi parallela?
Lezione: XI
Autovalori dai dati casuali:
47
L’analisi parallela risente della numerosità campionaria:
più casi = autovalori casuali più bassi.
Lezione: XI
Specifications for this Run: Ncases 875 Nvars 51
Ndatsets 100 Percent 95
Random Data Eigenvalues
Root Means Prcntyle 1.000000 1.495933 1.534748 2.000000 1.449547 1.483834 3.000000 1.413240 1.444165 4.000000 1.383953 1.414128 5.000000 1.357437 1.384085 6.000000 1.331171 1.350236 7.000000 1.308793 1.330356 8.000000 1.287407 1.311233 9.000000 1.267480 1.281856 10.000000 1.247886 1.263203 11.000000 1.228760 1.244180 12.000000 1.210060 1.227170 13.000000 1.190141 1.205910 14.000000 1.172808 1.187282 15.000000 1.155679 1.169908 16.000000 1.138982 1.154476 17.000000 1.121598 1.139739 18.000000 1.104409 1.120724 19.000000 1.089430 1.105355 20.000000 1.072517 1.084520
Specifications for this Run: Ncases 500 Nvars 51
Ndatsets 100 Percent 95
Random Data Eigenvalues
Root Means Prcntyle 1.000000 1.672771 1.746009 2.000000 1.609481 1.660897 3.000000 1.564153 1.601727 4.000000 1.519642 1.558364 5.000000 1.480668 1.523348 6.000000 1.447796 1.481292 7.000000 1.414189 1.446068 8.000000 1.382801 1.413905 9.000000 1.353541 1.378729 10.000000 1.326321 1.352325 11.000000 1.298140 1.321679 12.000000 1.274496 1.299248 13.000000 1.250528 1.274202 14.000000 1.226017 1.250066 15.000000 1.201603 1.224879 16.000000 1.176207 1.197266 17.000000 1.153673 1.175959 18.000000 1.131907 1.151592 19.000000 1.108754 1.123323 20.000000 1.088079 1.106564
48
Il ruolo della numerosità campionaria
Lezione: XI
Specifications for this Run: Ncases 300 Nvars 51
Ndatsets 100 Percent 95
Random Data Eigenvalues
Root Means Prcntyle 1.000000 1.901806 1.991302 2.000000 1.814015 1.888260 3.000000 1.744486 1.797096 4.000000 1.682084 1.726021 5.000000 1.632741 1.685500 6.000000 1.582558 1.624323 7.000000 1.540161 1.578705 8.000000 1.496538 1.530097 9.000000 1.456316 1.496262 10.000000 1.420003 1.453685 11.000000 1.386008 1.414737 12.000000 1.348015 1.378874 13.000000 1.315815 1.342266 14.000000 1.283528 1.309885 15.000000 1.250243 1.282854 16.000000 1.216737 1.247809 17.000000 1.185969 1.216461 18.000000 1.156671 1.191097 19.000000 1.131030 1.163106 20.000000 1.100921 1.129269
Specifications for this Run: Ncases 150 Nvars 51
Ndatsets 100 Percent 95
Random Data Eigenvalues
Root Means Prcntyle 1.000000 2.360547 2.490363 2.000000 2.208113 2.314111 3.000000 2.092358 2.208537 4.000000 1.995757 2.069388 5.000000 1.915092 1.978337 6.000000 1.841357 1.903147 7.000000 1.769473 1.823975 8.000000 1.708900 1.766805 9.000000 1.647847 1.697175 10.000000 1.590018 1.643570 11.000000 1.533903 1.593449 12.000000 1.481125 1.546693 13.000000 1.429721 1.477928 14.000000 1.380654 1.425280 15.000000 1.330646 1.377791 16.000000 1.282727 1.321975 17.000000 1.240862 1.280057 18.000000 1.196773 1.235461 19.000000 1.149549 1.185529 20.000000 1.110572 1.147559
49
Il ruolo della numerosità campionaria
Lezione: XI
Più piccolo è il campione, maggiore deve essere l’autovalore per essere considerato non casuale Per un campione che tende ad infinito, quali saranno gli autovalori casuali?
50
Analisi parallela (Horn, 1965)
Lezione: XI
E’ considerato il migliore dei criteri avanzati
Però anche in questo caso non sempre coincide con la soluzione “migliore”
Identifica i fattori che spiegano più varianza, rispetto a fattori presi a caso
Ma potrebbero non essere stabili (cf. Everett: non sempre i suggerimenti dei
due criteri coincidono)
E’ influenzato dalla numerosità campionaria
51
Goodness of fit test
Lezione: XI
Come funziona?
Prenderemo tanti fattori quanto sono necessari a ridurre a non
significativa la discrepanza tra correlazioni originali e quelle riprodotte
(R-R*= n.s.)
Si basa sul chi-quadro, ma usato in senso opposto (siamo contenti
quando non c’e’ differenza...)
oppure su altri indici relativi (ad es., CFI, AGFI)
La si trova nell’output SPSS
Usato soprattutto per Massima Verosomiglianza (ML) e per Analisi
Fattoriale Confirmatoria (AFC)
52
Esempio
Lezione: XI
Varianza totale spiegata
7.366 14.442 14.442 7.366 14.442 14.442
4.077 7.994 22.436 4.077 7.994 22.436
3.311 6.493 28.929 3.311 6.493 28.929
1.823 3.575 32.504 1.823 3.575 32.504
1.743 3.418 35.921 1.743 3.418 35.921
1.406 2.756 38.677 1.406 2.756 38.677
1.288 2.525 41.202 1.288 2.525 41.202
1.244 2.440 43.642 1.244 2.440 43.642
1.183 2.320 45.962 1.183 2.320 45.962
1.116 2.188 48.150 1.116 2.188 48.150
1.108 2.172 50.322 1.108 2.172 50.322
1.042 2.044 52.366 1.042 2.044 52.366
1.011 1.983 54.349 1.011 1.983 54.349
.971 1.904 56.253
.930 1.824 58.077
.903 1.772 59.848
.890 1.745 61.593
.845 1.657 63.251
.835 1.638 64.888
.821 1.610 66.498
.780 1.530 68.028
.776 1.521 69.550
.763 1.495 71.045
.752 1.474 72.519
.723 1.417 73.937
.699 1.371 75.307
.680 1.333 76.640
.663 1.299 77.939
.649 1.272 79.212
.630 1.236 80.448
.617 1.209 81.657
.588 1.153 82.809
.584 1.145 83.955
.576 1.130 85.085
.570 1.117 86.202
.561 1.101 87.303
.534 1.048 88.350
.514 1.008 89.359
.507 .995 90.353
.487 .955 91.308
.474 .930 92.239
.457 .896 93.135
.443 .869 94.003
.434 .852 94.855
.424 .831 95.686
.403 .789 96.475
.381 .747 97.222
.373 .731 97.953
.360 .706 98.659
.344 .674 99.333
.340 .667 100.000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
Totale % di v arianza % cumulata Totale % di v arianza % cumulata
Autov alori iniziali Pesi dei f attori non ruotati
Metodo di es trazione: Analis i componenti princ ipali.
53
Esempio (n=875)
Lezione: XI
Test di bontà di adattamento
3169.144 1125 .000
Chi-quadrato df Sig.
3 fattori
Test di bontà di adattamento
2251.296 1030 .000
Chi-quadrato df Sig.
5 fattori
Test di bontà di adattamento
941.253 690 .000
Chi-quadrato df Sig.
13 fattori (mineigen)
Test di bontà di adattamento
515.691 477 .107
Chi-quadrato df Sig.
19 fattori
54
Esempio (n=300)
Lezione: XI
3 fattori 5 fattori 16 fattori (mineigen)
14 fattori
Test di bontà di adattamento
1970.363 1125 .000
Chi-quadrato df Sig.
Test di bontà di adattamento
1555.465 1030 .000
Chi-quadrato df Sig.
Test di bontà di adattamento
586.374 579 .407
Chi-quadrato df Sig.
Test di bontà di adattamento
706.592 652 .068
Chi-quadrato df Sig.
55
Goodness of fit test
Lezione: XI
Tende a sovrastimare il numero di fattori validi
La logica sottostante e’ criticabile:
il punto fondamentale non e’ di spiegare al piu’ possibile la varianza
ma di trovare un modello semplice che pero’ spieghi a sufficienza.
Noi cerchiamo un modello della realta’, non la realta’
E’ influenzato dalla numerosita’ campionaria
Puo’ essere valido in certe condizioni: poche variabili, non troppi
soggetti, modello con molti fattori
Non e’ un metodo consigliato (ma può essere valido in certi contesti)
56
Cio’ che accade in pratica
Lezione: XI
Studio di Fabrigar et al. (1999): 1991-1995 su JPSP e JAP
Un totale di 217 studi con qualche tipo di AF
Mineigen: circa l7.5%
Scree-test: circa 15.3%
Analisi parallela: circa 0.5%
(1 studio su 217- ma molto più usata negli ultimi anni)
Metodi multipli: circa 21%
Non specificato: circa 40%
57
Cosa fare quindi?
Lezione: XI
Mineigein e’ il peggiore
AP, Scree-test, e stabilita’ sono i migliori
Non c‘e’ un metodo infallibile
E’ essenziale conoscere la teoria relativa ai dati che si esaminano
La teoria ci puo’ guidare a scegliere la soluzione migliore
Ci sono casi semplici e casi complessi
Nei casi complessi, e’ meglio usare piu’ metodi
L’esperienza e’ fondamentale
58
Soluzione ridotta
Lezione: XI
Qualunque sia il criterio per scegliere il numero di fattori, tenere un
numero di fattori ridotti comporta un aumento dell’efficienza ma una
perdita di capacità di rappresentazione di tutta la varianza
v2 v1
v4
v3
v3 v2
F1
Se tutti i fattori spiegano tutta la varianza
Un numero ridotto perderà un po’ di capacità di spiegazione ma catturerà gli aspetti principali
Lo scopo è di cercare di ottenere un buon equilibrio tra semplicità e rappresentatività
(modello parsimonioso)