Post on 01-May-2015
1
11%
15%
24%
22%
28%
Elementi di STATISTICA DESCRITTIVA
Elementi di STATISTICA DESCRITTIVA
____________________________
anno scolastico 2001/2002anno scolastico 2001/2002
Liceo Classico Linguistico “D. Crespi”
Corso di preparazione ai test universitari
Lezione 1
2
Che cos’è la statisticaChe cos’è la statistica
Nata per descrivere le caratteristiche demografiche, Nata per descrivere le caratteristiche demografiche,
economiche, … degli stati, èeconomiche, … degli stati, è
l'insieme delle tecniche utilizzate per raccogliere, l'insieme delle tecniche utilizzate per raccogliere, elaborare e interpretare i dati che riguardano elaborare e interpretare i dati che riguardano collettività, al fine di studiare un fenomeno e collettività, al fine di studiare un fenomeno e poterne prevedere gli sviluppi.poterne prevedere gli sviluppi.
3
Statistica
Statistica descrittiva
la ricerca statistica viene fatta sull’intera “popolazione”
• censimento della popolazione italiana
• rilevazione del gradimento della scuola
Statistica inferenziale
la ricerca viene fatta su un “campione casuale” della popolazione con lo scopo di ottenere informazioni relative all’intera popolazione
• verifica della durata delle batterie prodotte da una ditta
• proiezioni sull’esito delle elezioni politiche
4
La “Popolazione”: insieme degli “individui” o “unità statistiche” che presentano caratteristiche comuni:
• appartengono alla stessa nazione,
• frequentano la stessa scuola,• sono bovini allevati nella stessa stalla,• batterie prodotte dalla stessa ditta……
Chiaramente la scelta della popolazione dipende dagli obiettivi dell’indagine.
La rilevazione ed elaborazione statistica riguarda i “caratteri” o “argomenti” comuni agli individui della popolazione.
Il primo passo da fare in un’indagine statistica è individuare il gruppo di persone o oggetti che dobbiamo studiare, cioè
5
Caratteri
o tipi di dati
Qualitativi - “modalità”• colore degli occhi
• religione
Quantitativi - “valori” (espressi mediante
numeri)
• statura, peso, • durata delle batterie
6
• un carattere che assume valori diversi lo chiameremo variabile
esempi
1. Il peso degli studenti di una classe varia (in generale) da soggetto a soggetto
Il carattere “peso” è una variabile (quantitativa)
2. La temperatura esterna varia durante il giorno
la “temperatura” è una variabile (quantitativa)
3. Il colore degli occhi varia da persona a persona
il carattere “colore degli occhi” è una variabile (qualitativa)
7
• Le variabili differiscono anche per il tipo di misurazione che può essere fatta (tipi di scale).
1. La variabile “colore occhi” può assume le modalità: celeste, verde, marrone, nero ….
2. La variabile “titolo di studio” può assumere i valori: nessuno, lic. elementare, lic. media, lic. scuola superiore, laurea.
3. La variabile QI può assumere i valori:100, 120, 150, 89, ……
4. La variabile stipendio può assumere i valori:1 milione, 2 milioni, 40 milioni, ….
Livelli di misurazione delle variabili
8
Si distinguono 4 livelli o scale di misurazione:
1. Scala nominale
es. Colore degli occhi; sesso; nazionalità
• è il livello più basso della misurazione, i dati non hanno alcun ordine precostituito
• consente la comparazione in termini di uguale o diverso femmina = femmina, femmina maschio
2. Scala ordinale
es. Titolo di studio
• i valori possono esser ordinati secondo il criterio di “inferiore”, “superiore”, “migliore”; c’è un ordine logico nei dati.
• lic elementare < lic media < ….< laurea
Scale di misurazione
9
livelli o scale di misurazione:
3. Scala a intervalli
es. QI, Temperatura Celsius, Fahrenheit.
• è il primo livello propriamente quantitativo
• consente il calcolo della distanza (o differenza) tra due valori, ma non il loro rapporto
QI = 125– 100 =25
4. Scala di rapporti
es. Stipendio percepito, peso, età…..sono caratterizzati dall’avere uno Zero non convenzionale.
• i valori possono esser rapportati tra loro nel senso che si può dire che un valore è doppio o triplo di un altro
• 4 milioni = 4 • 1milione = 2 • 2 milioni
Scale di misurazione
10
• Le differenti scale di misurazione delle variabili determinano il tipo di indice statistico calcolabile.
Livello moda mediana media
Nominale SI NO NO
Ordinale SI SI NO
Intervalli SI SI SI
Rapporti SI SI SI
11
1. Studio del problema e impostazione della ricerca statistica:
• scopo della ricerca, definizione del fenomeno che vogliamo studiare, ipotesi che si vogliono provare
• individuazione della popolazione.
2. Rilevamento, classificazione e tabulazione dei dati:
• i dati raccolti vengono raggruppati in classi omogenee e riportati in tabelle
3. Rappresentazione grafica e analisi dei dati
• Diagrammi: la rappresentazione grafica dei dati consente di rilevare più facilmente le loro caratteristiche, ma manca di precisione.
Le fasi di una ricerca statistica
12
3. _________
• Elaborazione: consiste nell’esaminare i dati mediante metodi matematici al fine di determinare alcuni indici rappresentativi del fenomeno
4. Conclusioni dell’indagine:relazione conclusiva in cui viene riportato quanto rilevato in relazione al fenomeno studiato:
• il prodotto interno lordo è aumentato del 5% negli ultimi 10 anni
• si è osservato un aumento della piovosità media nel mese di gennaio
Le fasi di una ricerca statistica
13
Le rappresentazioni grafiche hanno lo scopo di rappresentare in Le rappresentazioni grafiche hanno lo scopo di rappresentare in modo semplice, modo semplice, a colpo d’occhio, a colpo d’occhio, le caratteristiche di una le caratteristiche di una distribuzione di frequenza.distribuzione di frequenza.
Rappresentazioni grafiche di distribuzioni univariate
Hanno l’inconveniente di mancare di precisione e di Hanno l’inconveniente di mancare di precisione e di prestarsi a letture soggettiveprestarsi a letture soggettive
Sono di diverso tipo e vanno scelte in relazione al tipo di Sono di diverso tipo e vanno scelte in relazione al tipo di dati da rappresentare.dati da rappresentare.
14
Rappresentazioni grafiche di distribuzioni univariate
Vediamo alcuni esempi di rappresentazioni grafiche e utilizziamo come dati quelli della seguente tabella:
Anno di corso frequenza freq.rel freq.%
1 5 0,11 10,92 7 0,15 15,23 11 0,24 23,94 10 0,22 21,75 13 0,28 28,3
Totale complessivo 46 1 100,0
15
Rappresentazioni grafiche di distribuzioni univariate
ISTOGRAMMI:ISTOGRAMMI: sono grafici a barre verticali. sono grafici a barre verticali. Sull’asse orizzontale vengono riportati i valori della Sull’asse orizzontale vengono riportati i valori della variabile, mentre sull’asse verticale le frequenze variabile, mentre sull’asse verticale le frequenze
assolute, o relative, o percentuali con cui le variabili assolute, o relative, o percentuali con cui le variabili compaiono.compaiono.
Un istogramma è una rappresentazione arealeareale, cioè l’area dei rettangoli, e non la loro altezza, è proporzionale alla frequenza del dato.
16
Rappresentazioni grafiche - ISTOGRAMMI
ISTOGRAMMA dei dati
57
11 1013
0
5
10
15
1 2 3 4 5
anno di corso
fre
qu
en
za a
ss
olu
ta
17
Rappresentazioni grafiche di distribuzioni univariate
DIAGRAMMI a BARRE:DIAGRAMMI a BARRE: i dati vengono rappresentati mediante linee continue i dati vengono rappresentati mediante linee continue più o più o meno spesse.meno spesse. L’altezza o lunghezza delle barre è proporzionale alla frequenza L’altezza o lunghezza delle barre è proporzionale alla frequenza del dato.del dato.
Negli Negli Ortogrammi Ortogrammi o o grafici a nastrigrafici a nastri gli assi sono scambiati per gli assi sono scambiati per consentire una lettura più facile: consentire una lettura più facile:
sull’asse x sono riportate le frequenze, sull’asse x sono riportate le frequenze, sull’asse y i valori delle variabilisull’asse y i valori delle variabili
18
Rappresentazioni grafiche - Diagrammi a Barre - ORTOGRAMMI
Diagramma a barre (Ortogramma)
5
7
11
10
13
0 2 4 6 8 10 12 14
1
2
3
4
5
anno
di c
orso
frequenze assolute
19
Rappresentazioni grafiche di distribuzioni univariate
AEROGRAMMI:AEROGRAMMI: le frequenze di una variabile qualitativa vengono le frequenze di una variabile qualitativa vengono
rappresentate mediante superfici di figure piane: quadrati rappresentate mediante superfici di figure piane: quadrati
rettangoli, cerchi..rettangoli, cerchi.. Le frequenze dei dati sono proporzionale all’area delle superfici. Le frequenze dei dati sono proporzionale all’area delle superfici.
del dato.del dato.
Nei Nei DIAGRAMMI CIRCOLARI o a TORTADIAGRAMMI CIRCOLARI o a TORTA si divide il cerchio si divide il cerchio in settori proporzionali alla frequenza del datoin settori proporzionali alla frequenza del dato
20
Rappresentazioni grafiche - Diagrammi CIRCOLARI
Aerogramma - Diagramma circolare o a torta
11%
15%
24%22%
28%1
2
3
4
5
21
Rappresentazioni grafiche di distribuzioni univariate
DIAGRAMMA POLARE:DIAGRAMMA POLARE: viene utilizzato principalmente per rappresentare caratteri viene utilizzato principalmente per rappresentare caratteri
relativi a fenomeni ciclici (relativi a fenomeni ciclici (mensili, settimanali, giornalierimensili, settimanali, giornalieri))
Le frequenze dei dati sono proporzionale alla distanza dal centroLe frequenze dei dati sono proporzionale alla distanza dal centro
Diagramma Polare 5
7
1110
13
1
2
34
5
22
Rappresentazioni grafiche di distribuzioni univariate
CARTOGRAMMI:CARTOGRAMMI: vengono utilizzati per rappresentare dati relativi a vengono utilizzati per rappresentare dati relativi a
distribuzioni geografichedistribuzioni geografiche: : densità di popolazione per regione, produzione agricola per densità di popolazione per regione, produzione agricola per
regione, nazione ecc…regione, nazione ecc…
23
Rappresentazioni grafiche - CARTOGRAMMI