Gruparea datelor• date punctuale sau individuale, • datele grupate (pe variante, pe intervale egale sau neegale)Gruparea unităţilor statistice în funcţie de o caracteristică
semnificativă numită factor de grupare. Metoda grupării presupune stabilirea frecvenţelor absolute
pentru grupe de variante ale caracteristicii de grupare, numite intervale statistice sau intervale de grupare.
Caracteristica de grupare poate fi de natură cantitativă sau calitativă.
Gruparea tipologică - factorul de grupare de natură cantitativă, poate delimita grupe calitative diferite, numite tipuri calitative (ex: intervalele de salarii sau de venituri: mici, medii, mari și foarte mari).
Gruparea datelor după caracteristici numerice
• A, amplitudinea variaţiei caracteristicii A = xmax - xmin,
• r, număr de grupe,• k, mărimea a intervalului: .• formula lui H.A. Sturges (1926)
rA
k
)(log1)(log322,31 210 NNr
)(log322,31 10 N
A
r
Ak
Construirea unei distribuţii de frecvenţe
Pașii:– stabilirea mărimii intervalului,– dimensionarea datelor primare pe clase– numărarea observărilor din fiecare clasă.
Recomandări:• un număr mai mare de 4 - 5 clase, dar nu mai mult de 12 - 15
clase, pentru că se fărâmiţează colectivitatea,• evitarea claselor deschise sau în caz contrar închiderea
intervalelor deschise, cu mărimea intervalelor alăturate,• păstrarea aceleași mărimi a intervalului, dacă este posibil,• existenţa unor clase disjuncte.
Serii statistice
• O serie statistică este formată din minim două șiruri de date: - primul șir reprezintă
• Unităţi de timp• Unităţi administrativ teritoriale (judeţe, regiuni, orașe/
ramuri economice, agenţi economici)• variaţia unei caracteristici pe intervale sau variante,
- iar al doilea șir este format fie din:- frecvenţele de apariţie a unităţilor statistice – rezultate
prin operaţia de numărare sau centralizare, - fie din variantele unei alte caracteristici, aflată în
corelaţie cu prima, care devine astfel factor de grupare.
Clasificarea seriilor statistice• natura caracteristicii de grupare:
– Serii de timp (serii cronologice sau dinamice),– Serii de spaţiu (serii teritoriale)– Serii atributive.
• Seria statistică formată din grupele sau variantele caracteristicii de grupare și frecvenţe sale de apariţie este o serie unidimensională; dacă numărul caracteristicilor este mai mare decât 2, seria statistică este multidimensională.
Tabele statistice
• Tabel simplu (crt. timp, spatiu, crit organizatoric), • Tabel pe grupe• Tabel cu dublă intrare (de contingenţă)• Tabel combinat, • Tabel de asociere
Tabele simpleAnii
Productie otel (tone)
1990 25
1991 11
1992 15
1993 21
1994 17
1995 10
1996 9
1997 19
• Analize transversale, timp=constant • Analize longitudinale, timp=variabil• Analize mixte (aspecte de evoluţie în timp și în spaţiu)
2012Regiuni Productia (t)
Centru 25Sud 11Sud-vest 15Vest 21Nord 17Nord-vest 10Est 9Bucuresti 19
Total 127
2012-2013, FSEAA Bv
Specializari Nr. studentiMN 47MK 42BA 41FB 37CIG 34
ECTS 28AI 27IE 21
Total 277
Tabel pe grupeGrupe angajati dupa salariu (lei), xi
Număr angajați,
fi
sub-1500 7
1500-2500 24
2500-3500 38
peste 3500 21
total 90
Grupe angajati dupa salariu (lei), xi
Număr angajați,
fi
500-1500 7
1500-2500 24
2500-3500 38
3500-4500 21
total 90
Grupe angajati dupa salariu (lei/lună), xi
Număr angajați,
fi
Vânzări realizate (mil lei), yi
Frecvențe relative, fi*
(%)
500-1500 7 2100 7.8%
1500-2500 24 18000 26.7%
2500-3500 38 36500 42.2%
3500-4500 21 21300 23.3%
total 90 77900 100.0%
Tabel cu dublă intrareGrupe de vechime (ani), xi
Subgrupe dupa timpul nelucrat (minute), yj
Total, ni
35 - 45 45 - 55 55 - 6540 50 60
Sub 10 0 25 75 10010 – 20 24 80 56 160Peste 20 126 14 0 140Total, fj 150 119 131 400
Opinia, y Grupe de vârstă, x Total
sub 30 ani 30 – 50 ani peste 50 ani
Favorabilă 65 55 40 160
Nefavorabilă 115 35 40 190
Total 180 90 80 350
Grafice - elemente
• Elemente de forma și de conţinut::– Titlul gr.– Graficul propriu-zis: axe, linii curbe, puncte– Scara de reprezentare– Legenda – Note explicative– Sursa datelor
Grafice - tipuri • Tipuri de grafice:
– Prin coloane, benzi– Diagrame de structura: pie, doughnut– Historiograme, cronograme– Grafice de distributie (crt. pe Ox si frecv. pe Oy):
histograma, poligonul frecventelor, curba cumulativa a frecventelor
– Grafice de corelatie (nori de puncte)– Cartograme si cartodiagrame (harti)– Prin simboluri si imagini
Principiul lui ParetoVilfredo Pareto (1843 – 1923)• Născut la Paris, Universitatea din Torino: inginerie și
matematică• Univ. din Lausanne, Elveţia (1896) - “Cours
d’economie politique”– a demonstrat că distribuţia venitului și a
bunăstării în societate nu este aleatoare;– tendinţa apare de-a lungul istoriei în toate
societăţile; aproximativ 80% din bunăstarea totală într-o societate se află concentrată la numai 20% din familii;
– “vital few and the trivial many” – principiul lui Pareto în economie.
REZUMATUL STATISTIC • mărimi relative• mărimile medii:
• mărimi medii ale tendinţei centrale • mărimi de poziţie (structură)
• indicatorii variaţiei • caracterizarea formei de distribuţie
• indicatorii asimetriei • indicatorii concentării
• indicatorii unei caracteristici alternative• indicatorii unei colectivităţi împărţită în grupe
• analiza dispersională
Mărimi relative
• M. r. de structură• M. r. de intensitate• M. r. de dinamică• M. r. ale planului• M. r. de coordonare
, Mărimile medii ale tendinţei centrale
• Media aritmetică• Media pătratică• Media geometrică• Media armonică • Media cronologică
Media aritmetică
- este indicatorul tendinţei centrale, cel mai des utilizat.
În cazul unei serii simple (valori fără frecvenţe), se calculează media aritmetică simplă.
Fie seria x1, x2, ...xn ; n fiind numărul de variante ale caracteristicii. Media aritmetică simplă este: .
Pentru o serie cu frecvenţe, se utilizează media aritmetică ponderată.
Fie seria x1, x2, ...xn cu frecvenţele f1, f2, ..., fn ; n fiind aici, numărul de grupe.
Media aritmetică ponderată este: .
n
xx
n
ii
1
n
ii
i
n
ii
f
fxx
1
1
Media aritmetică (cont.)
• Dacă seria este discretă, variantele caracteristicii xi, se înmulţesc cu frecvenţele corespunzătoare fiecăreia și se raportează la totalul frecvenţelor colectivităţii.
• Dacă seria este continuă, adică există gruparea unităţilor statistice pe baza valorilor caracteristicii, atunci se consideră mijloacele acestor intervale ca fiind valorile xi, iar fi, frecvenţa fiecărei grupe.
• Dacă se utilizează frecvenţele relative fi*, atunci media aritmetică ponderată va fi:
, unde .*
1i
n
ii fxx
n
ii
ii
f
ff
1
*
Media pătratică
• se utilizează la calculul unui indicator al variaţiei: abaterea medie pătratică.
• Media pătratică se calculează ca rădăcină pătrată a mediei pătratelor valorilor caracteristicii, astfel:
, pentru o serie simplă, fără frecvenţe;
, pentru o serie cu frecvenţe.
n
xx
n
ii
p
1
2
n
ii
i
n
ii
p
f
fxx
1
1
2
Media geometrică
• se utilizează la calculul indicilor și formulele sunt:
, pentru o serie simplă, fără frecvenţe; calculul se poate face prin logaritmare: .
, pentru o serie cu frecvenţe; calculul se poate face prin logaritmare: .
n
n
iig xx
1
n
xx
n
ii
g
1
)log()log(
n
ii
if n
i
fig xx 1
1
n
ii
n
iii
g
f
xfx
1
1
)log()log(
Media armonică • se utilizează în calculul mărimilor medii de intensitate (care se
obţin din raportul a doi indicatori diferiţi, cu unităţi de măsură diferite) ex: preţul mediu, ca raport între valoarea și cantitatea vândută, productivitatea medie, salariul mediu, randamentul etc.).
• Formulele sunt:, pentru o serie simplă, fără frecvenţe;
, pentru o serie cu frecvenţe.
n
ii
i
n
ii
a
fx
fx
1
1
1
n
i i
a
x
nx
1
1
Media cronologică • se utilizează la calculul mediei termenilor unei serii cronologice
de momente. Momentele pot fi situate la intervale egale și atunci se utilizează media cronologică simplă:
.
Dacă momentele se situează la intervale neegale atunci se utilizează media cronologică ponderată:
unde fi reprezintă mărimea intervalelor (număr zile, 1 lună =30 zile) şi fiecare termen xi se ponderează cu jumătate din mărimea intervalelor alăturate.
12
...2 1321
n
xxxx
x
x
nn
cr
n
ii
nn
nnn
cr
f
fx
ffx
ffx
ffx
fx
x
1
11
323
212
11 22
...222
Top Related