Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli...

31
Slide_Cerbara_parte1 La disuguaglianza

Transcript of Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli...

Page 1: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Slide_Cerbara_parte1

La disuguaglianza

Page 2: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di disuguaglianza Caso 1: Tutte le unità del collettivo presentano la stessa modalità del carattere. La

media, tra quelle calcolabili per quel carattere, se sostituita alle modalità non cambia la distribuzione e quindi rappresenta bene la distribuzione.

Caso 2: Tutte le unità del collettivo presentano modalità diverse del carattere. La media in questo caso è una sintesi che non rappresenta bene la distribuzione.

Caso 3: Non tutte le unità del collettivo presentano modalità diverse del carattere. La media in questo caso è una sintesi che non rappresenta bene la distribuzione ma lo fa meglio che nel caso precedente.

Esempi. Caso1. Un collettivo di individui tutti italiani (stessa modalità del carattere nazionalità) Caso 2. Un collettivo di individui tutti di differente nazionalità Caso 3. Un collettivo di individui di cui il 50% italiani, il 30% inglesi, il 20% francesi.

Page 3: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di disuguaglianza Quindi una media di una distribuzione dà informazioni, sulla distribuzione, tanto

minori quanto più la distribuzione è lontana dal caso in cui il carattere è presente in tutte le unità con un’unica modalità. Comprendiamo quindi che è necessario individuare delle misure della disuguaglianza, rispetto ad un carattere, delle unità di un collettivo.

Queste misure debbono assumere il loro valore minimo nel caso in cui tutte le unità siano uguali fra loro e il massimo nel caso in cui si possa individuare il massimo della disuguaglianza.

Esse sono chiamate perciò indici di disuguaglianza della distribuzione Questi indici non hanno niente a che fare con i numeri indici visti in precedenza.

Page 4: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di disuguaglianza Un modo per calcolare la disuguaglianza in un collettivo può essere quello di misurare

i cambiamenti che occorrono per portare il collettivo alla minima disuguaglianza, cioè il caso 1.

Ovviamente dipende sempre dal tipo di carattere che abbiamo a disposizione. Gli indici di disuguaglianza hanno perciò una struttura diversa e un nome diverso a seconda delle relazioni fra le modalità o delle operazioni che possiamo fare su di esse: se teniamo conto che fra le modalità sussistano soltanto l’uguaglianza e la disuguaglianza, chiameremo gli indici di disuguaglianza indici di eterogeneità, se supponiamo che le modalità siano almeno ordinate parleremo di indici di dispersione ed infine se possiamo anche addizionare o sottrarre le modalità, useremo la dizione di indici di variabilità

Page 5: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di disuguaglianza Ricordiamo però, che tutto quello che si può fare su un carattere qualitativo può

essere fatto su un carattere quantitativo. Quindi su questi ultimi caratteri si possono calcolare tutti gli indici, anche se usando un indice di livello di misura inferiore possiamo perdere o non usare tutte le informazioni, mentre abbiamo dei limiti maggiori su caratteri qualitativi.

Per confrontare tra più distribuzioni i risultati ottenuti faremo riferimento a indici relativi di disuguaglianza, cioè indici di disuguaglianza che divideremo per un denominatore opportuno che dipende dall’intervallo in cui tale indice può variare.

Page 6: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di eterogeneità Si possono calcolare per i caratteri qualitativi sconnessi, e dunque per ogni tipo di

carattere. Diciamo che il collettivo è completamente omogeneo rispetto ad una modalità se

tutte le unità presentano la stessa modalità del carattere. Viceversa, se almeno una unità non presenta la stessa modalità del carattere, diciamo che c’è eterogeneità rispetto alla modalità.

Esempio. Un gruppo di 9 persone è omogeneo rispetto alla religione cattolica se tutte e 9 professano la religione cattolica; è eterogeneo rispetto alla religione cattolica se vi è almeno 1 persona che non professa la religione cattolica.

Per calcolare l’indice di eterogeneità rispetto ad una modalità dobbiamo tener presente che tale indice deve essere minimo quando tutte le unità presentano la stessa modalità del carattere.

Page 7: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di eterogeneità Esempio. Abbiamo un gruppo di 9 persone così ripartite rispetto al carattere (qualitativo sconnesso) religione: 4 persone sono cattoliche, 2 sono protestanti e 3 sono ortodosse. Vogliamo costruire un indice di eterogeneità rispetto alla religione cattolica e quindi dobbiamo determinare i cambiamenti che dovremmo effettuare per ottenere la situazione in cui tutte e 9 le persone professino la religione cattolica: si dovrebbero convertire alla religione cattolica coloro che non la professano, ossia 9 – 4=5 persone. Ma il numero totale di cambiamenti possibili è uguale al numero delle unità del collettivo perché potenzialmente ogni unità può cambiare religione.

Assumiamo come indice di eterogeneità rispetto alla religione cattolica il rapporto 9−4

9=5

9

Quanto più alto è il numero di coloro che si dovrebbero convertire, rispetto al totale del gruppo, tanto minore è l’omogeneità rispetto alla religione cattolica e quindi tanto maggiore è l’eterogeneità rispetto alla religione cattolica. Possiamo dire che questo indice di eterogeneità è specifico della religione cattolica. L’analogo indice specifico di eterogeneità rispetto alla religione protestante è 7/9 e quello rispetto alla religione ortodossa è 6/9. Possiamo quindi confermare che il gruppo considerato è più eterogeneo rispetto alla religione protestante, ha un’eterogeneità intermedia rispetto alla religione ortodossa e presenta la minore eterogeneità rispetto alla religione cattolica.

Page 8: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di eterogeneità Quindi, in termini generali, possiamo definire un indice specifico di eterogeneità

rispetto alla modalità xi come 𝑛−𝑛𝑖

𝑛= 1 −

𝑛𝑖

𝑛= 1 − 𝑓𝑖

Ma anche 𝑛

𝑛𝑖=1

𝑓𝑖 può essere inteso come indice di eterogeneità

Questi sono indici specifici di eterogeneità rispetto alla modalità xi perché crescono al

decrescere di ni, a parità di n, o di fi. Se ni = n, il primo indice assume il valore minimo 0 e il secondo indice assume il valore minimo 1.

Page 9: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici generali di eterogeneità Se non facciamo riferimento ad una specifica modalità, possiamo parlare di indici

generali di eterogeneità. Possiamo assumere come indice di eterogeneità il rapporto fra il numero dei cambiamenti da effettuare per raggiungere la massima omogeneità, rispetto a tutte le modalità, e quello dei cambiamenti possibili perché in questo modo l’indice è indipendente dalla numerosità del collettivo

Possiamo assumere come indice di eterogeneità della distribuzione il rapporto fra il numero dei cambiamenti da effettuare per raggiungere la massima omogeneità, rispetto a tutte le modalità, e quello dei cambiamenti possibili

𝐸 = 1 − 𝑛𝑖

𝑛

2𝑘𝑖=1 oppure 𝐸 = 1 − 𝑓𝑖

2𝑘𝑖=1 INDICE DI ETEROGENEITA’ DI GINI

Page 10: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici generali di eterogeneità Esempio. Tornando al gruppo considerato nell’esempio precedente, l’omogeneità può realizzarsi o se tutte le 9 persone sono cattoliche o se tutte le 9 persone sono protestanti o se tutte le 9 persone sono ortodosse. I cambiamenti possibili sono 9 × 9 = 81. Secondo la formula precedente, l’indice di eterogeneità generale è

𝐸 = 1 −4

9

2

+2

9

2

+3

9

2

= 1 −16 + 4 + 9

81= 1 −

29

81=51

81

Un altro famoso indice di eterogeneità è l’entropia 𝐻 = − 𝑓𝑖 log𝑎 𝑓𝑖𝑘𝑖=1 un indice

molto usato nella fisica e in particolare nella termodinamica Il logaritmo in questa formula può assumere qualunque base a ma di solito si usa la base 10 e la base e.

Page 11: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici generali di eterogeneità L’indice E assume valore minimo 0 quando una delle fi è uguale ad 1 e tutte le altre

frequenze relative sono uguali a 0. Assume valore massimo quando tutte le fi sono uguali fra loro. In questo caso, se abbiamo k unità, ogni 𝑓𝑖 =

1

𝑘, pertanto

𝐸 = 1 − 1

𝑘

2

= 1 −𝑘

𝑘2= 1 −

1

𝑘=𝑘 − 1

𝑘

Quindi 0 ≤ 𝐸 ≤𝑘−1

𝑘

e allora possiamo definire un indice relativo, dividendo E per il suo massimo

ETEROGENEITA’ RELATIVA 𝑒 =𝑘

𝑘−1𝐸

Page 12: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici generali di eterogeneità Esempio. Calcoliamo gli indici di eterogeneità E, e per la distribuzione (di fonte Istat) degli

stranieri residenti in Italia al 31 dicembre 2005 secondo l’area geografica di provenienza.

𝐸 = 1 − 𝑓𝑖2 = 1 − 0,21 = 0,79𝑘

𝑖=1

𝑒 =𝑘

𝑘−1𝐸 =

11

11−10,79 = 0,87

Page 13: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di dispersione Consideriamo un carattere è quindi almeno qualitativo ordinato rettilineo. Se nel collettivo vi è almeno un’unità in cui il carattere è presente con una modalità

diversa da quella delle altre unità, che nel collettivo vi è dispersione del carattere rispetto alla modalità considerata.

Anche in questo caso possiamo pensare di cercare prima un indice specifico rispetto ad una sola modalità e poi passare al caso generale.

Anche stavolta possiamo pensare ad un indice pensando ai cambiamenti che occorrerebbe fare nella distribuzione per passare dalla situazione di dispersione a quella di dispersione nulla in cui tutte le unità presentano la stessa modalità del carattere.

Page 14: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di dispersione Esempio. Consideriamo la distribuzione di un collettivo di 18 unità che hanno risposto ad una domanda sull’istituzione di una ZTL. Vogliamo costruire un indice di dispersione rispetto ad una delle cinque modalità, supponiamo la modalità D. Dobbiamo determinare quindi i cambiamenti che dovremmo effettuare per ottenere la situazione di dispersione nulla ossia quella in cui tutte e 18 le persone diano la stessa risposta, cioè la D. Chi ha dato la risposta A, per arrivare a dare la risposta D deve fare ben 3 cambiamenti: da A a B, da B a C, da C a D. Seguendo questo ragionamento perché tutti diano la risposta D abbiamo bisogno di fare 3x4+3x2+7x1+0x2+1x2=27 cambiamenti Avendo 18 persone, abbiamo 27/18=1,5 cambiamenti per persona. Questo valore è quello che assumiamo come indice di dispersione della distribuzione rispetto alla modalità D.

Page 15: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di dispersione Questo ragionamento può spiegare la formula per il calcolo dell’indice specifico di dispersione rispetto alla modalità xi

𝐷𝑖∗ =1

𝑛 ℎ − 𝑖 𝑛ℎ𝑘ℎ=1 per 𝑖 = 1,2, … , 𝑘

Esempio. Usando questa formula calcoliamo per l’esempio precedente tutti gli indici specifici di dispersione. Si può vedere immediatamente come la dispersione minore si ha rispetto alla modalità C che in effetti raccoglie più consensi ed è anche in posizione centrale cosicché richiede il minimo sforzo per raggiungere la dispersione nulle.

Page 16: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno riferimento ad una modalità specifica. Si ottiene la dispersione nulla se tutte le unità presentano come unica modalità la una delle modalità possibili, o la x1 o la x2 o … o la xk . Come abbiamo visto a proposito degli indici di eterogeneità, possiamo ottenere un indice generale facendo la media aritmetica ponderata degli indici specifici rispetto a ciascuna modalità con peso pari alla frequenza di questa modalità. Perciò l’indice di dispersione è la media aritmetica ponderata degli indici specifici di dispersione visti in precedenza.

𝐷∗ =1

𝑛 𝐷𝑖

∗𝑛𝑖

𝑘

𝑖=1

=1

𝑛2 𝑛𝑖

𝑘

𝑖=1

ℎ− 𝑖 𝑛ℎ

𝑘

ℎ=1

Page 17: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di dispersione Esempio. Nell’esempio precedente per calcolare D* basta moltiplicare per ni ogni ogni Di* già calcolato e sommare il risultato così ottenuto. Tale somma va poi divisa per n, cioè per 18, ottenendo 442/182=1,36

𝐷∗ =1

𝑛 𝐷𝑖

∗𝑛𝑖

𝑘

𝑖=1

=1

𝑛2 𝑛𝑖

𝑘

𝑖=1

ℎ− 𝑖 𝑛ℎ

𝑘

ℎ=1

La formula D* può essere espressa anche mediante le frequenze assolute cumulate o le frequenze relative cumulate

𝐷∗ =2

𝑛2 𝑁𝑖 𝑛 − 𝑁𝑖𝑘−1𝑖=1 𝐷∗ =

2

𝑛2 𝐹𝑖 1 − 𝐹𝑖𝑘−1𝑖=1

Page 18: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di dispersione Esempio. Ancore l’esempio precedente. Per calcolare D* usiamo ora le frequenze cumulate. L’ultima colonna ha somma 221. Essa va moltiplicata per 2 e divisa per 182, ottenendo 442/324=1,36

𝐷∗ =2

𝑛2 𝑁𝑖 𝑛 − 𝑁𝑖𝑘−1𝑖=1

L’indice di dispersione D* vale 0 nel caso di dispersione minima e vale 𝑘−1

𝑘 al massimo.

Perciò l’indice relativo si può calcolare come

𝑑∗ =2

𝑘 − 1𝐷∗

Page 19: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Consideriamo ora le distribuzioni secondo un carattere quantitativo. Se, relativamente al carattere considerato, un collettivo è omogeneo rispetto ad una

modalità, nel collettivo il carattere non è variabile, ossia vi è variabilità nulla del carattere rispetto alla modalità.

Se non c’è variabilità nulla rispetto ad una modalità, significa che vi sono alcune unità in cui il carattere è presente con una modalità diversa da quella. In questo caso diciamo che nel collettivo vi è variabilità del carattere rispetto alla modalità. Vogliamo ora costruire degli indici specifici di variabilità rispetto ad una modalità. Per fare ciò è necessario valutare il cambiamento che dobbiamo sostenere per trasformare ciascuna modalità xh nel valore x. È evidente che il cambiamento è tanto maggiore quanto più lontano è xh da x, ossia quanto maggiore è lo scostamento | xh – x |

Page 20: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Possiamo usare allora la media di ordine t di questo scostamento per calcolare

scostamento medio di ordine t della distribuzione dal valore x.

𝑆𝑡 𝑥 =1

𝑛 𝑥ℎ − 𝑥

𝑡

𝑛

ℎ=1

𝑡

Se si usano le frequenze assolute o relative, la formula dello scostamento diventa

𝑆𝑡 𝑥 =1

𝑛 𝑥ℎ − 𝑥

𝑡𝑛ℎ𝑘ℎ=1

𝑡 𝑆𝑡 𝑥 = 𝑥ℎ − 𝑥

𝑡𝑓ℎ𝑘ℎ=1

𝑡

Questi scostamenti assumono valore minimo 0 in caso di assenza di variabilità

Page 21: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Uno scostamento medio utilizzato di frequente è quello per cui t = 1, ossia, rispettivamente Esempio. Per la distribuzione per unità di 5 oggetti a seconda del peso (espresso in ettogrammi):

1, 2, 4, 5, 6 la cui mediana è Me = 4 hg e la media aritmetica 𝑥 = 3,6 hg, determiniamo sia lo scostamento semplice medio dalla mediana sia quello dalla media aritmetica. Dobbiamo calcolare perciò la media aritmetica dei valori assoluti degli scostamenti: 1–4=–3; 2–4=–2; 4–4=0; 5–4=1; 6–4=2 e quella dei valori assoluti degli scostamenti: 1–3,6=–2,6; 2–3,6=–1,6; 4–3,6=0,4; 5–3,6=1,4; 6–3,6=2,4.

Troviamo 𝑆 𝑀𝑒 =3+2+0+1+2

5= 1,6 hg 𝑆 𝑀𝑒 =

2,6+1,6+0,4+1,4+2,4

5= 1,68 hg.

Page 22: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Per t=2 abbiamo uno scostamento molto utilizzato che prende nome di scosta- mento

quadratico medio della distribuzione dal valore x.

Esempio. Per la distribuzione per unità dell’esempio precedente determiniamo sia lo scostamento quadratico medio dalla mediana sia quello dalla media aritmetica. Troviamo

Page 23: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Lo scostamento semplice medio dalla media aritmetica è detto anche, per antonomasia, lo scostamento semplice medio (omettendo cioè l’indicazione della media a cui si fa riferimento) e anche lo scostamento quadratico medio dalla media aritmetica è chiamato abitualmente scostamento quadratico medio e, con una convenzione, quasi ovunque accettata, è indicato con la lettera greca minuscola sigma cioè con σ. Il quadrato di questo scostamento è chiamato varianza

Page 24: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Anche il numeratore della varianza nσ è importante ed è chiamato devianza. Il calcolo della varianza, e quindi quello dello scostamento quadratico medio, può essere reso più facile dalla formula che esprime la varianza in funzione della media aritmetica di x e della media quadratica M2

2 (che ricordiamo è la somma dei quadrati diviso per il numero di elementi)

Page 25: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Esempio. Consideriamo la distribuzione degli iscritti nelle liste di leva dei nati nel 1980 secondo la statura Considerato il valore rappresentativo della classe e la distribuzione di frequenze assolute, calcoliamo i prodotti tra il quadrato del valore rappresentativo della classe e tali frequenze. Facciamo infine la somma di tali valori. La mediana è Me=172 cm in quanto questa statura è preceduta e seguita dalla metà delle stature. La media è 174,6 cm. Per il nostro calcolo occorrono i valori di M22 e del quadrato della media aritmetica: Perciò

Page 26: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Un’altra strada che permette di ovviare agli inconvenienti, indicati all’inizio del paragrafo precedente, è quella di dividere ogni indice assoluto di variabilità per una media. Agli indici, che così otteniamo, è dato il nome di indici percentuali di variabilità. Anche questi indici sono numeri puri e consentono, perciò, quei confronti che non sono possibili in base agli indici assoluti. Gli indici percentuali esprimono la variabilità del carattere nel collettivo non in via assoluta, ma in relazione all’intensità media del carattere nel collettivo e sono quindi indipendenti da tale intensità media. La denominazione «percentuali» deriva dal fatto che spesso il rapporto è espresso come una percentuale della media, in quanto si moltiplica usualmente per 100 il quoziente fra l’indice di variabilità e la media. Per esempio sono indici percentuali di variabilità: l’indice al centro è il più usato ed è chiamato coefficiente di variazione (Pearson, 1895)

Page 27: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Ora vogliamo capire quali sono le informazioni che la media aritmetica e lo scostamento quadratico medio forniscono su una distribuzione. Cioè, vogliamo rispondere alla domanda: se di una distribuzione incognita si conoscono soltanto la media aritmetica e lo scostamento quadratico medio, quali informazioni questi indici forniscono sulla distribuzione incognita? A questa domanda si può rispondere con di teorema di Bienaymé-Cebycev: per una qualunque distribuzione di cui si conoscono solamente la media aritmetica e lo scostamento quadratico medio, la frequenza relativa dei termini della distribuzione, che sono non interni ad un intorno della media di raggio fissato, non può superare un certo limite; ovvero, che la frequenza relativa dei termini della distribuzione che sono interni all’intorno non può essere inferiore ad un certo limite.

Page 28: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Gli indici di variabilità Il teorema di Bienaymé-Cebycev afferma che data una distribuzione di valori xi dei quali si conosce la media aritmetica e lo scostamento quadratico medio, comunque si fissa un numero reale non negativo a > σ, si ha che i termini non interni all’intorno di raggio a della media aritmetica hanno una frequenza relativa che non supera σ2/a2

𝑓𝑟𝑒𝑞 𝑥𝑖 ≤ 𝑥 − 𝑎; 𝑥𝑖 ≥ 𝑥 + 𝑎 ≤𝜎2

𝑎2 oppure, che è lo stesso, 𝑓𝑟𝑒𝑞 𝑥𝑖 − 𝑥 ≥ 𝑎 ≤

𝜎2

𝑎2

Esempio. Per tutte le distribuzioni che hanno x = 10 e σ = 1, sappiamo, in base al teorema suddetto, che i termini della distribuzione che non sono interni all’in- torno di raggio 2 della media arimetica 10, ossia che sono non interni all’intervallo (8; 12), possono costituire tutt’al più il 25% del totale dei termini della distribuzione; perciò quelli interni possono costituire almeno il 75% del totale dei termini della distribuzione. Se invece il raggio è 3, in base al teorema di Bienaymé-Cebycev, si sa che i termini non interni all’intervallo (7; 13) possono costituire tutt’al più l’11,1% del totale dei termini della distribuzione e quindi quelli interni possono costituire almeno l’88,9% del totale dei termini.

Page 29: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Distribuzione degli scarti e distribuzione standardizzata

Può essere necessario talvolta ridurre due distribuzioni ad avere la stessa media aritmetica al fine di esaminare altre sue caratteristiche, come ad esempio la variabilità, ecc. Il modo più semplice per ottenere ciò è quello di ridurre ogni distribuzione ad avere media 0 sostituendo alla distribuzione per unità 𝑥1,𝑥2, … , 𝑥𝑖 , … , 𝑥𝑛 quella degli scarti dalla media aritmetica 𝜀1 = 𝑥1 − 𝑥 , 𝜀2 = 𝑥2 − 𝑥 , … , 𝜀𝑖 = 𝑥𝑖 − 𝑥 , … , 𝜀𝑛 = 𝑥𝑛 − 𝑥 Questa distribuzione distribuzione degli scarti ha media 0 perché la somma degli scarti dalla media aritmetica è sempre nulla. Però il confronto fra due distribuzioni può essere difficile se esse hanno diversa media aritmetica e diverso scostamento quadratico medio. Si devono ridurre allora le due distribuzioni ad avere la stessa media aritmetica e lo stesso σ; il modo più semplice è quello di fare ricorso ad una distribuzione di scarti divisi per σ

Page 30: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Distribuzione degli scarti e distribuzione standardizzata Questa è la distribuzione standardizzata associata alla distribuzione iniziale Essa può anche essere una distribuzione di frequenze. Ogni distribuzione standardizzata ha la media aritmetica uguale a 0 e lo scostamento quadratico medio uguale ad 1.

Page 31: Slide Cerbara parte1 - Dipartimento di Scienze Sociali ed ... · Gli indici di dispersione Gli indici generali di dispersione o, semplicemente, gli indici di dispersione non fanno

Distribuzione degli scarti e distribuzione standardizzata Esempio. Vediamo come si costruisce la distribuzione standardizzata. Sia data la distribuzione di pesi espressi in chilogrammi,

3; 3,5; 4; 4; 5,5 che ha media aritmetica 4 kg e scostamento quadratico medio σ = 0,84 kg. La distribuzione standardizzata si calcola come:

Quindi la distribuzione standardizzata è: -1,19; -0,60; 0,00; 0,00; 1,79. Essa ha media 0 e varianza circa 1.

Le distribuzioni standardizzate hanno per modalità numeri puri, perché rapporti fra quantità con la stessa unità di misura e permettono il confronto anche fra distribuzioni secondo caratteri diversi misurati in differenti unità di misura.