Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è...

19
Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili, ossia per capire il grado di associazione tra due variabili. Variabili quantitative: si parla di correlazione tra variabili e si utilizza il grafico di dispersione Variabili qualitative: si parla di dipendenza tra variabili e si usa la tabella di frequenza doppia

Transcript of Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è...

Page 1: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Associazione tra due variabiliOltre a descrivere un singola variabile, la statistica

descrittiva è utile anche per descrivere contemporaneamente due variabili, ossia per capire il grado di associazione tra due variabili.

• Variabili quantitative: si parla di correlazione tra variabili e si utilizza il grafico di dispersione

• Variabili qualitative: si parla di dipendenza tra variabili e si usa la tabella di frequenza doppia

Page 2: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Variabili quantitativeSOGGETTI ANSIA DEPRESSIONE

1 5 72 2 53 1 24 3 55 7 96 6 8

La relazione tra due variabili quantitative si rappresenta sul “grafico di dispersione”, utilizzando i punteggi di ciascun soggetto in X e in Y come coordinate.Per interpretare il grafico si usano le medie delle due variabili, che vanno a formare 4 quadranti.

Page 3: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Grafico crescente: ansia e depressione

Page 4: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Grafico decrescente: ansia e voto

Page 5: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Punteggi sparsi: ansia e intelligenza

Page 6: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Il grafico di dispersione• Quando la nuvola di punti è inclinata verso l’alto,

da sinistra a destra, vi è una relazione crescente : le variabili sono direttamente proporzionali.

• Quando la nuvola di punti è inclinata verso il basso, da sinistra a destra, vi è una relazione decrescente : le variabili sono inversamente proporzionali.

• Quando la nuvola di punti è sparsa, ossia vi sono dei punti in tutti i quadranti, vi è assenza di correlazione.

Page 7: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

La correlazione• La correlazione è un “valore” che esprime la

relazione lineare tra due variabili quantitative, ossia indica se e quanto due variabili “variano” insieme.

• È necessario pertanto calcolare la “covarianza” e poi, per standardizzare, ossia dividere per il prodotto delle due deviazioni standard.

• Essendo un coefficiente standardizzato varia tra -1 e 1.

-1<r<-0,5 -0,5<r<0,5 0,5<r<1Correlazione alta

e negativaAssenza di

correlazioneCorrelazione alta

e positiva

Page 8: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Calcolo della varianza

N

XXXX 2

La varianza indica quanto variano i punteggi di una variabile e consiste nel calcolare la somma degli scarti quadratici, diviso N

Per calcolare la covarianza, invece, bisogna considerare due variabili contemporaneamente.Per calcolare la correlazione, la covarianza deve essere standardizzata per il prodotto delle due deviazioni standard.

Page 9: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Calcolo del coefficiente r

YXxy

N

YYXX

r

rxy= Coefficiente di correlazione di PearsonNumeratore = covarianza (σ2

XY)Denominatore = prodotto delle deviazioni standard

Page 10: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Calcolo del coefficiente rSog X Y1 5 7

2 2 5

3 1 2

4 3 5

5 7 9

6 6 8

(X-4) (Y-6)

1 1-2 -1-3 -4-1 -13 32 2

σx 2,16

σy 2,31σxσy 4,99

(X-4)2 (Y-6)2

1 14 19 161 19 94 4

Σ28/6 Σ32/6σ=√4,67 σ=√5,33

(X-4) (Y-6)

12

12194

Ẍ 4Ȳ 6

Σ29Cov=29/6Cov=4,83

Page 11: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Coefficiente r

99,4

83,4

99,4629

YXxy

N

YYXX

r

rxy=0,97

Essendo r compreso tra 0,5 e 1, e come anticipato dal grafico la correlazione è alta e positiva.

Page 12: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Formule alternative: punti z(da non usare)

N

zzr yxxy

Procedura: 1) Calcolare i punti z per X e Y;2) Moltiplicare i punti z relativi allo stesso soggetto; 3) Sommare tutti i prodotti4) Dividere per N

Page 13: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Calcolo del coefficiente r: Punti zSog X Y1 5 7

2 2 5

3 1 2

4 3 5

5 7 9

6 6 8

Zx Zy Zx Zy

0,46 0,43 0,2-0,93 -0,43 0,4-1,39 -1,73 2,4-0,46 -0,43 0,21,39 1,30 1,80,93 0,87 0,8

Σ5,8

6

8,5xyr

97,0xyr

σx 2,16

σy 2,31σxσy 4,99

Ẍ 4Ȳ 6

Page 14: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Formula alternativa “semplificata” (da non usare)

YXxy

XYN

XY

r

Procedura:1)Moltiplicare ciascun punteggio di X per il relativo punteggio di Y2)Sommare tali prodotti3)Dividere per N4)Sottrarre per il prodotto delle medie di X e Y5)Dividere il numeratore per il prodotto delle DS

Page 15: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Calcolo del coefficiente r: f. sempl.S X Y1 5 7

2 2 5

3 1 2

4 3 5

5 7 9

6 6 8

X*Y35102

156348

Σ173

σx 2,16

σy 2,31

σxσy 4,99

Mx 4

My 6

MxMy 24

99,4

246173

xyr

97,0xyr

Page 16: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Interpretazione di r• Il coefficiente r di Pearson è sempre compreso

tra -1 ed 1. In particolare:

-1<r<-0,5 -0,5<r<0,5 0,5<r<1

Correlazione alta e negativa:

grafico decrescente

Assenza di correlazione:

assenza di linearità

Correlazione alta e positiva: grafico

crescente

Page 17: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Esercitazione: Costruire il grafico di dispersione e calcolare la correlazione

Soggetti Ansia Intelligenza

1 2 52 3 23 3 54 4 4

Page 18: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Grafico di dispersione

Possiamo supporre che vi sia assenza di correlazione, poiché i punti sono sparsi

Page 19: Associazione tra due variabili Oltre a descrivere un singola variabile, la statistica descrittiva è utile anche per descrivere contemporaneamente due variabili,

Calcolo del coefficiente rSog X Y1 2 52 3 23 3 54 4 4

(X-3) (Y-4)

-1 10 -20 11 0

σx 0,71

σy 1,22σxσy 0,87

(X-3)2 (Y-4)2

1 10 40 11 0

Σ2/4 Σ6/4σ=√0,5 σ=√1,5

(X-3) (Y-4)

-1000

Ẍ 3Ȳ 4

Σ-1Cov=-1/4Cov=-0,25

29,087,0

25,0

87,041

xyr Assenza di correlazione