Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità...

54
Indici di sintesi

Transcript of Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità...

Page 1: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Indici di sintesi

Page 2: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Indici (Statistiche)� Gran parte della analisi statistica consiste nel condensare

complessi pattern di osservazioni in un indicatore che sia

capace di riassumere una specifica caratteristica di tutte

le rilevazioni in un singolo numero

� In statistica descrittiva distinguiamo:

� Indici di tendenza centrale (o indici di posizione)

� che esprimono il valore “tipico”

� Indici di dispersione (o indici di variabilità)

� che esprimono quanto i dati si raggruppano strettamenteintorno al valore ”tipico”

� Indici di forma

� che esprimono le caratteristiche di “simmetria” e

“curvatura” della distribuzione dei dati

Page 3: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Indici (Statistiche)� Indici di tendenza centrale

�Moda

�Mediana

�Media

� Indici di dispersione

� Range

� Range interquartile

� Percentili

�Deviazione standard, varianza

Page 4: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Indici di tendenza centrale

Page 5: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Moda, media

e mediana

Page 6: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Moda� È il valore che si verifica più

frequentemente�Per quale tipologia di dati è calcolabile?

� dati categorici binomiali, nominali e ordinali

� Dati numerici discreti� (quando le modalità osservate siano poche)

� dati numerici continui� è la classe di valori osservata più frequentemente

� …..è quindi necessario prima raggruppare in classi le

osservazioni

Page 7: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Moda

� Si determina contando la frequenza

delle modalità

� Non tiene conto di tutte le altre modalità,

utilizza un solo elemento della distribuzione

� Ci può essere più di un valore modale in una

distribuzione

� Due valori con la stessa frequenza

� Due valori con frequenze simili

Page 8: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Moda� Esempio: Il volume espiratorio forzato in 13 adolescenti

asmatici (in litri)

� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3

� Si costruisce una tabella di frequenza

� Il valore 2.8 si presenta tre volte, i valori 2.6 e 4.0 si presentano

2 volte ciascuno, tutti gli altri valori si presentano una volta sola

� 2.8 è la moda della distribuzione

� N.B. La moda si riferisce al valore più frequente (2.8), non alla

frequenza di tale valore (3)

Page 9: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Mediana

� Il valore, che, dopo aver posto le

osservazioni in ordine crescente, divide il

campione in due gruppi di eguale

numerosità�Per quale tipologia di dati è calcolabile?

� dati categorici ordinali

� dati numerici discreti

� dati numerici continui

Page 10: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Mediana� Si calcola individuando

� Nelle serie dispari il valore al centro della distribuzione ordinata

(valore nella (n+1)/2 esima posizione)

� Nelle serie pari è la media dei due valori al centro della

distribuzione ordinata (media tra il valore nella n/2 esima e il valore

nella (n/2)+1 esima posizione)

� E’ detta anche 50° percentile

� Utilizza le relazioni di posizione dei dati (>,<)

� Non è sensibile ai valori estremi

� E’ il migliore indice di sintesi nelle distribuzioni

asimmetriche

Page 11: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Mediana� Esempio: Il volume espiratorio forzato in 13 adolescenti

asmatici (in litri)

� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3

� Ordina i 13 valori xi� 2.1, 2.2, 2.3, 2.6, 2.6, 2.8, 2.8, 2.8, 3.0, 3.3, 3.5, 4.0, 4.0

� Calcolo:� Nelle serie dispari (N=13 è dispari) è il valore al centro della

distribuzione ordinata

• valore nella (n+1)/2 esima posizione = 7a posizione

� 2.1, 2.2, 2.3, 2.6, 2.6, 2.8, 2.8, 2.8, 3.0, 3.3, 3.5, 4.0, 4.0

Page 12: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Media aritmetica� La somma di tutti i valori rilevati in un campione divisaper la numerosità

� Utilizza le proprietà delle relazioni aritmetiche (quantità,operazioni)� Esiste solo per i dati numerici continui e discreti

� Sintetizza tutti i dati: è il valore più vicino a tutte lesingole osservazioni

� E’ invariante per trasformazioni affini� +k, - k, *k, /k sui dati

• spostano nello stesso senso la media

� E’ valida soprattutto per i dati che seguono unadistribuzione di frequenza normale

� E’ sensibile ai valori estremi

Page 13: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

La Media aritmetica� Significato:

�Quanto sarebbero alti i soggetti che abbiamo studiato,se fossero tutti uguali?

∑=

n

i

ix

1

ix

1x

2x 3x

n

x

x

n

i

i∑=

=1

x x x

Page 14: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Media aritmetica

� Esempio: Il volume espiratorio forzato in 13

adolescenti asmatici (in litri)� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3

� Somma dei 13 valori xi� 2.3+2.1+3.5+2.6+2.8+2.8+4.0+2.2+2.6+3.0+4.0+2.8+3.3= 38

� Divisione per n=13

� 38 / 13 = 2.9

n

x

x

n

i

i∑=

=1

Page 15: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Valutare una distribuzione di frequenza

� Simmetrica Unimodale�Media = Mediana = Moda

� Simmetrica Bimodale�Moda1 < Media = Mediana < Moda2

� Asimmetrica a destra�Moda < Mediana < Media

� Asimmetrica a sinistra�Media < Mediana < Moda

Page 16: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Media per dati raggruppati

� La media aritmetica si può calcolare anchesenza avere i valori di ogni singolaosservazione, basandosi su dati aggregati�Es. consideriamo la seguente tabella, che riporta ladistribuzione di frequenza del n° di sigarettefumate ogni giorno da un campione di 20 persone

N° sig. Frequenza0 65 810 520 1

Page 17: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Media per dati raggruppati

� La media aritmetica può esserecalcolata come media “pesata” deidiversi valori�I pesi sono rappresentati dalla frequenza diciascun valore

�N° sig. medio=(0*6+5*8+10*5+20*1)/20=5.5

Page 18: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Media per dati raggruppati� La media aritmetica può essere calcolata, con una certaapprossimazione, anche quando, invece dei singoli valori,sono riportati degli intervalli di valori della variabile diinteresse� Es. consideriamo la seguente tabella, che riporta ladistribuzione di frequenza dei valori di frequenza cardiaca ariposo in un campione di 20 persone

Freq. Card. Frequenza40-49 250-59 460-69 670-79 480-89 390-99 1

Page 19: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Media per dati raggruppati

� In questo caso, si prende il valorecentrale di ogni intervallo e si usa laformula descritta in precedenza�Freq. Card. media =(45*2+55*4+65*6+75*4+85*3+95*1)/20=67.5

Page 20: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Di un gruppo di atleti raccogliamo delleinformazioni relative al tipo di sportpraticato, al peso, all'altezza ed alnumero di infortuni subiti

� Calcolare:

�L'altezza media e mediana

�Lo sport più praticato

�La media, la mediana e la moda del numero di

infortuni

Page 21: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Il dataset

Page 22: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Calcolare il valore medio del n° di sit-upseffettuati da un campione di 30 atletiin un giornoN° sit-ups Frequenza5 610 815 620 230 550 3

Page 23: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Calcolare il valore medio della PressioneArteriosa Sistolica negli stessi atletiN° sit-ups Frequenza<100 2100-109 3110-119 3120-129 5130-139 8140-149 4150-159 2160-169 3

Page 24: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Hai raccolto i valoridel peso (espresso inlibbre) dei canottieridi Oxford eCambridge

Page 25: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Di seguito sono riportati i valori medi emediani (in libbre) per i due equipaggi�Cambridge: media=182, mediana=186�Oxford: media=180, mediana=185

� Ti aspetti che la distribuzione siasimmetrica?

Page 26: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� La distribuzione del peso dell’equipaggio diCambridge (9 canottieri)

1** | 091** |1** |1** | 791** | 83, 85, 86, 89, 952** | 04, 14

Page 27: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione� La distribuzione del peso dei due equipaggi(18 canottieri)

02

46

Fre

qu

en

cy

100 150 200weight

Page 28: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Indici di variabilità

Page 29: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

La variabilità

Page 30: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Misurare la variabilità di una distribuzioneDistribuzione A Distribuzione B

xi ni fi

10 1 0.01

20 2 0.02

30 94 0.94

40 2 0.02

50 1 0.01

tot 100 1.00

xi ni fi

10 10 0.10

20 20 0.20

30 40 0.40

40 20 0.20

50 10 0.10

tot 100 1.00

Moda(A)= 30

Mediana(A)=30

Media (A) =30

Moda(B)= 30

Mediana(B)=30

Media (B) =30

Le due distribuzioni si possono dire uguali?

Page 31: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Misurare la variabilità di una distribuzionedistribuzione frequenze A e B

0

20

40

60

80

100

10 20 30 40 50

distribuzione A

distribuzione B

Le osservazioni della distribuzione A sono per la maggior parte in corrispondenza del valore medio

Le osservazioni della distribuzione B sono più disperse rispetto al valore medio

Page 32: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Misurare la variabilità di una distribuzione

� I dati delle due distribuzioni hanno undiverso livello di dispersione

� I dati delle due distribuzioni sonodifferentemente distribuiti intorno alloro valore medio

� Le due distribuzioni hanno una diversavariabilità

Page 33: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Indici di variabilità

� La variabilità o dispersione è unconcetto chiave in statistica�Molte analisi vengono condotte allo scopo di

studiare le cause della variabilità di un

fenomeno

� Indici di variabilità sono:�Il range, o intervallo massimo-minimo�Il range inter-quartile�La varianza�La deviazione standard

Page 34: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Il range

� Il range, o intervallo massimo-minimo,individua le due osservazioni estremedi una distribuzione, ovvero la piùgrande e la più piccola�È quindi molto facile calcolare il range

�Il limite di questa misura è che è facilmenteinfluenzabile da osservazioni anomale, cioèmolto più grandi o molto più piccole dellamaggior parte delle osservazioni

Page 35: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Il Range

Campo di variazione

R = Max - Min

Distribuzione A

xi ni fi

10 1 0.01

20 2 0.02

30 94 0.94

40 2 0.02

50 1 0.01

tot 100 1.00

R = 50 - 10

Page 36: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Hai raccolto i valoridel peso (espresso inlibbre) dei canottieridi Oxford eCambridge�Calcola il range di valori,per i due team

Page 37: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Quantili� Per QUANTILI si intende la suddivisionedi una distribuzione in gruppi ordinati e dieguale numerosità

� Decili: dieci gruppi� Quintili: cinque gruppi� Quartili: quattro gruppi� Centili (o percentili): cento gruppi

�Per PERCENTILE si intende la suddivisione in 100parti uguali di una serie di valori continui� ad esempio pesi o altezze di bambini

� Un bambino che superi il 90% percentile avrà dunque un valore(es. di altezza) superiore al 90% di tutti i bambini considerati

Page 38: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

PercentiliConsideriamo una variabile Y, ordinabile, conmodalità:

y1, y2 , y3 , …, yk

� 1° percentile= valore di y che separa il primo 1%delle osservazioni

�2° percentile= valore di y che separa il primo 2%delle osservazioni

�n° percentile= valore di y che separa il primo n%delle osservazioni

Page 39: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

� Calcolo del p-esimo Percentile�Considerando n osservazioni ordinate�ed intendendo calcolare il valore del p-esimo percentile� valutiamo l’ espressione (n*p)/100

� se NON è un intero• il p-esimo percentile sarà l’ osservazione che sitrova alla posizione data da np/100 approssimatoper eccesso

� se è un intero• il p-esimo percentile sarà la media tra l’osservazione che si trova nella posizione np/100 e l’osservazione che si trova nella posizione successiva

Percentili

Page 40: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

� Calcolo del p-esimo Percentile�75° percentile nel nostro esempio di 13 osservazioni

� valutiamo l’ espressione (n*p)/100

� 75*13/100 = 9.75 � NON è un intero

• il p-esimo percentile sarà l’ osservazione che si

trova alla posizione data da np/100 approssimato

per eccesso

• e cioè la 10a osservazione dopo aver ordinato i dati

� 2.1, 2.2, 2.3, 2.6, 2.6, 2.8, 2.8, 2.8, 3.0, 3.3, 3.5, 4.0, 4.0

Percentili

Page 41: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Le curve di crescita

� Le curve riportate nel

grafico rappresentano

alcuni percentili del

peso in bambine e

ragazze (10-20 anni)

negli USA

Page 42: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

1°°°° quartile = 25°°°° percentile

2°°°° quartile = 50°°°° percentile

3°°°° quartile = 75°°°° percentile

Mediana

Quartili di una distribuzione

Page 43: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Il range inter-quartile

� E’ la differenza tra il terzo quartile(75° percentile) e il primo quartile (25°percentile)

� E’ l’ampiezza dell’intervallo checontiene il 50% centrale dei dati

� Non è influenzato dai valori estremi

�N.B. sia il range che la differenza interquartile

sono singoli numeri, non intervalli

Page 44: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Hai raccolto i valoridel peso (espresso inlibbre) dei canottieridi Oxford eCambridge�Calcola i quartili delladistribuzione

Page 45: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Diagrammi a scatola

� Sono utili per verificare la asimmetria delle distribuzioni di frequenza

� La scatola centrale si estende dal 25° percentile al 75° percentile (i “quartili” dei dati)

� La linea dentro la scatola rappresenta la mediana

� Le linee al di fuori della scatola si estendono ai valori adiacenti, osservazioni più estreme che non superano più di 1,5 volte l’altezza della scatola esternamente ad ognuno dei quartili

Page 46: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Diagrammi a scatola1

00

15

02

00

25

0w

eig

ht

Page 47: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Diagrammi a scatola1

00

15

02

00

25

0Cambridge Oxford

we

igh

t

Graphs by team

Page 48: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Misurare la variabilità di una distribuzione

� Come migliorare ulteriormente lemisura della variabilità?�Utilizzare misure che tengano conto di tutti itermini della distribuzione in studio

�Calcolare lo scarto tra il valore di ciascunaosservazione ed il valore medio di tutte leosservazioni

�Calcolare la media di tutti gli scarti� Distanza media dei punti della distribuzionedalla media della distribuzione stessa

Page 49: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

� E’ un valore sintetico che vuole esprimere la distanza media diogni singola osservazione dalla media aritmetica del campione

� Idealmente, la distanza media delle osservazioni dallamedia artimetica del campione si potrebbe studiarecalcolando la media aritmetica dei semplici scarti.� Tuttavia, per la stessa definizione della media aritmetica, la somma degli

scarti è pari a zero

� Allora, per evitare l’ azzeramento della somma degliscarti, si calcola la media dei quadrati degli scarti� per la varianza di una popolazione:

� per la varianza in un campione• si tende ad essere più conservativi:

Varianza

n

x

n

i

i∑=

=1

2

2

)( µ

σ

1

)(1

2

2

=

∑=

n

xx

s

n

i

i

Page 50: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Varianza� Utilizza le proprietà delle relazioniaritmetiche (quantità, operazioni)

� Esiste solo per i dati numerici continui ediscreti

� E’ valida soprattutto per i dati che seguonouna distribuzione di frequenza normale

� E’ sensibile ai valori estremi� La sua unità di misura non è quella dellamedia�è al quadrato!

Page 51: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Varianza� Esempio

�Si calcolano gli scarti� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3� 2.3-2.9, 2.1-2.9, 3.5-2.9, …� -0.6, -0.8, +0.6, -0.3, -0.1, -0.1, +1.1, -0.7, -0.3, +0.1, +1.1, -0.1, +0.4

� si calcolano i quadrati degli scarti� 0.36, 0.64, 0.36, 0.09, 0.01, 0.01, 1.21, 0.49, 0.09, 0.01, 1.21, 0.01, 0.16

� Si calcola la media dei quadrati degli scarti (con i gradi dilibertà)� 0.36+0.64+0.36+0.09+0.01+0.01+1.21+0.49+0.09+0.01+1.21+0.01+0.16

� 4.65/(13-1) = 0.3875 litri 2

• attenzione: è in una scala al quadrato !

1

)(1

2

2

=

∑=

n

xx

s

n

i

i

Page 52: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Deviazione standard� E’ un valore sintetico che vuole esprimerela distanza media di ogni singolaosservazione dalla media aritmetica delcampione

� E’ la radice quadrata della varianza, e ne ha lestesse proprietà

� Ha la stessa unità di misura della mediaaritmetica

Page 53: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Deviazione standard� Esempio

�Si calcolano gli scarti� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3� 2.3-2.9, 2.1-2.9, 3.5-2.9, …� -0.6, -0.8, +0.6, -0.3, -0.1, -0.1, +1.1, -0.7, -0.3, +0.1, +1.1, -0.1, +0.4

� si calcolano i quadrati degli scarti� 0.36, 0.64, 0.36, 0.09, 0.01, 0.01, 1.21, 0.49, 0.09, 0.01, 1.21, 0.01, 0.16

� Si calcola la media dei quadrati degli scarti (con i gradi dilibertà)� 0.36+0.64+0.36+0.09+0.01+0.01+1.21+0.49+0.09+0.01+1.21+0.01+0.16

� 4.65/(13-1) = 0.3875 litri 2

� Sqrt(0.3875)=0.622 litri

Page 54: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo

Esercitazione

� Hai raccolto i valori delpeso (espresso in libbre)dei canottieri di Oxforde Cambridge�Calcola varianza edeviazione standard perl’equipaggio di Cambridge

�Media=182