Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è...
-
Upload
short-form-of-italian-names-ending-with -
Category
Documents
-
view
224 -
download
0
Transcript of Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è...
Associazione tra due variabiliOltre a descrivere un singola variabile, la statistica
descrittiva è utile anche per descrivere contemporaneamente due variabili, ossia per capire il grado di associazione tra due variabili.
• Variabili quantitative: si parla di correlazione tra variabili e si utilizza il grafico di dispersione
• Variabili qualitative: si parla di dipendenza tra variabili e si usa la tabella di frequenza doppia
Variabili quantitativeSOGGETTI ANSIA DEPRESSIONE
1 5 72 2 53 1 24 3 55 7 96 6 8
La relazione tra due variabili quantitative si rappresenta sul “grafico di dispersione”, utilizzando i punteggi di ciascun soggetto in X e in Y come coordinate.Per interpretare il grafico si usano le medie delle due variabili, che vanno a formare 4 quadranti.
Grafico crescente: ansia e depressione
Grafico decrescente: ansia e voto
Punteggi sparsi: ansia e intelligenza
Il grafico di dispersione• Quando la nuvola di punti è inclinata verso l’alto,
da sinistra a destra, vi è una relazione crescente : le variabili sono direttamente proporzionali.
• Quando la nuvola di punti è inclinata verso il basso, da sinistra a destra, vi è una relazione decrescente : le variabili sono inversamente proporzionali.
• Quando la nuvola di punti è sparsa, ossia vi sono dei punti in tutti i quadranti, vi è assenza di correlazione.
La correlazione• La correlazione è un “valore” che esprime la
relazione lineare tra due variabili quantitative, ossia indica se e quanto due variabili “variano” insieme.
• È necessario pertanto calcolare la “covarianza” e poi, per standardizzare, ossia dividere per il prodotto delle due deviazioni standard.
• Essendo un coefficiente standardizzato varia tra -1 e 1.
-1<r<-0,5 -0,5<r<0,5 0,5<r<1Correlazione alta
e negativaAssenza di
correlazioneCorrelazione alta
e positiva
Calcolo della varianza
N
XXXX 2
La varianza indica quanto variano i punteggi di una variabile e consiste nel calcolare la somma degli scarti quadratici, diviso N
Per calcolare la covarianza, invece, bisogna considerare due variabili contemporaneamente.Per calcolare la correlazione, la covarianza deve essere standardizzata per il prodotto delle due deviazioni standard.
Calcolo del coefficiente r
YXxy
N
YYXX
r
rxy= Coefficiente di correlazione di PearsonNumeratore = covarianza (σ2
XY)Denominatore = prodotto delle deviazioni standard
Calcolo del coefficiente rSog X Y1 5 7
2 2 5
3 1 2
4 3 5
5 7 9
6 6 8
(X-4) (Y-6)
1 1-2 -1-3 -4-1 -13 32 2
σx 2,16
σy 2,31σxσy 4,99
(X-4)2 (Y-6)2
1 14 19 161 19 94 4
Σ28/6 Σ32/6σ=√4,67 σ=√5,33
(X-4) (Y-6)
12
12194
Ẍ 4Ȳ 6
Σ29Cov=29/6Cov=4,83
Coefficiente r
99,4
83,4
99,4629
YXxy
N
YYXX
r
rxy=0,97
Essendo r compreso tra 0,5 e 1, e come anticipato dal grafico la correlazione è alta e positiva.
Formule alternative: punti z(da non usare)
N
zzr yxxy
Procedura: 1) Calcolare i punti z per X e Y;2) Moltiplicare i punti z relativi allo stesso soggetto; 3) Sommare tutti i prodotti4) Dividere per N
Calcolo del coefficiente r: Punti zSog X Y1 5 7
2 2 5
3 1 2
4 3 5
5 7 9
6 6 8
Zx Zy Zx Zy
0,46 0,43 0,2-0,93 -0,43 0,4-1,39 -1,73 2,4-0,46 -0,43 0,21,39 1,30 1,80,93 0,87 0,8
Σ5,8
6
8,5xyr
97,0xyr
σx 2,16
σy 2,31σxσy 4,99
Ẍ 4Ȳ 6
Formula alternativa “semplificata” (da non usare)
YXxy
XYN
XY
r
Procedura:1)Moltiplicare ciascun punteggio di X per il relativo punteggio di Y2)Sommare tali prodotti3)Dividere per N4)Sottrarre per il prodotto delle medie di X e Y5)Dividere il numeratore per il prodotto delle DS
Calcolo del coefficiente r: f. sempl.S X Y1 5 7
2 2 5
3 1 2
4 3 5
5 7 9
6 6 8
X*Y35102
156348
Σ173
σx 2,16
σy 2,31
σxσy 4,99
Mx 4
My 6
MxMy 24
99,4
246173
xyr
97,0xyr
Interpretazione di r• Il coefficiente r di Pearson è sempre compreso
tra -1 ed 1. In particolare:
-1<r<-0,5 -0,5<r<0,5 0,5<r<1
Correlazione alta e negativa:
grafico decrescente
Assenza di correlazione:
assenza di linearità
Correlazione alta e positiva: grafico
crescente
Esercitazione: Costruire il grafico di dispersione e calcolare la correlazione
Soggetti Ansia Intelligenza
1 2 52 3 23 3 54 4 4
Grafico di dispersione
Possiamo supporre che vi sia assenza di correlazione, poiché i punti sono sparsi
Calcolo del coefficiente rSog X Y1 2 52 3 23 3 54 4 4
(X-3) (Y-4)
-1 10 -20 11 0
σx 0,71
σy 1,22σxσy 0,87
(X-3)2 (Y-4)2
1 10 40 11 0
Σ2/4 Σ6/4σ=√0,5 σ=√1,5
(X-3) (Y-4)
-1000
Ẍ 3Ȳ 4
Σ-1Cov=-1/4Cov=-0,25
29,087,0
25,0
87,041
xyr Assenza di correlazione