Analiza i Sinteza Podataka
-
Upload
essojezicar -
Category
Documents
-
view
346 -
download
0
Transcript of Analiza i Sinteza Podataka
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 1/87
ANALIZA I SINTEZA PODATAKA
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 2/87
ANALIZA I SINTEZA PODATAKA 39
• 2.1. FREKVENCIJE I KUMULATIVNE FREKVENCIJE 39
• 2.1.1. Definicije 39
• 2.1.2. Formalizacija definicija 40
• 2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI 44
• 2.2.1. Kvalitativne varijable 44
• 2.2.1.1. Kvalitativna nominalna varijabla 44
• 2.2.1.2. Kvalitativna ordinalna varijabla 45• 2.2.2. Kvantitativne varijable 45
• 2.2.2.1. Kvantitativna prekidna varijabla 45
• 2.2.2.2. Kvantitativna neprekidna varijabla 45• 2.3. GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE 45
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 3/87
• Pročitajte sljedeći tekst:
• “Prosječan statističar je oženjen sa 1,75 žena koje čine sve što jemoguće da ga udalje od kuće 2,25 noći u sedmici sa samo 50%uspjeha.
• Nagib njegovog čela je 2%, on posjeduje 5/8 jednog računa u bancii ima 3,06 djece koji ga napola izluđuju; 1,65 od njegove djece sudječaci.
• Subotom uveče on angažuje 1/3 baby-sitter da čuva njegovo 3,06djece, u slučaju da 5/8 njegove punice koja živi sa njima u kući ne
pristane da čuva djecu za polovinu cijene.”
• T.H.Wonnacott, R.J.Wonnacott: Statistique, Economica, 3eme
edition, Paris, str.28.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 4/87
Diskusija o tekstu
• Na koji način je prezentovana informacija?
• Da li biste vi koristili ovakav način
prezentacije?
• Kako biste vi komentarisali ovaj tekst?
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 5/87
N
f p i
i =
2.1. Frekvencije i kumulativne
frekvencije• Definicije
• Absolutna frekvencija je broj (učestalost)pojavljivanja jednog modaliteta i njen simbol je fi
• Relativna frekvencija je jednaka absolutnojfrekvenciji modaliteta podijeljenoj sa ukupnom
frekvencijom:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 6/87
• Absolutna kumulativna frekvencija Sj(može biti rastuća: ≤ i opadajuća: > )
• Relativna kumulativna frekvencija Fj(može biti rastuća: ≤ i opadajuća: > )
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 7/87
• Kumulativna rastuća absolutna frekvencija
jednog modaliteta je jednaka zbirufrekvencija modaliteta za koje varijabla
ima vrijednost manju ili jednaku od togmodaliteta.
• Kumulativna opadajuća absolutnafrekvencija jednog modaliteta je jednaka
zbiru frekvencija modaliteta za kojevarijabla ima vrijednost striktno veću od
tog modaliteta.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 8/87
• Kumulativna rastuća relativna frekvencija
jednog modaliteta je jednaka proporcijielemenata za koje varijabla ima vrijednost
manju ili jednaku od tog modaliteta.
• Kumulativna opadajuća relativnafrekvencija jednog modaliteta je jednaka
proporciji modaliteta za koje varijabla imavrijednost striktno veću od tog modaliteta.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 9/87
• Prema definiciji zbir kumulativne rastućerelativne frekvencije jednog modaliteta ikumulativne opadajuće relativnefrekvencije istog modaliteta je jednak jedinici (ili 100%).
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 10/87
N f f f f x X S
f f f x X S
f f x X S
f x X S
k jk
j j
=++++=≤
+++=≤
+=≤
==
......)(
................
...)(................
)(
)(
21
21
212
11
• Kumulativnu distribuciju absolutnih
frekvencija na osnovu vrijednosti diskretnevarijable formiramo na slijedeći način:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 11/87
)()(S k,1,2,..., j ,)(1
j j
j
i
i j x X f x f xS ≤===
∑=
• j-ti član kumulativne distribucije možemo
napisati u obliku:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 12/87
j
max j
max jmin
min j
x ),()(
x,
xx ,)(0
x, 0
)(
<≤
>
≤≤≤≤
<
=
i ji
j j
x xS xS
x N
x N xS
x
xS
• Osobine kumulativne distribucije s
absolutnim frekvencijama su:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 13/87
)()(F k,1,2,..., j ,)(1
j j
j
i
i j x X p x p x F ≤===
∑=
• j-ti član kumulativne distribucije relativnih
frekvencija možemo napisati u obliku:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 14/87
j
max j
max jmin
min j
x ),()(
x , 1
xx ,1)(0
x, 0
)(
<≤
>
≤≤≤≤
<
=
i ji
j j
x x F x F
x
x x F
x
x F
• Osobine rastuće kumulativne distribucije
sa relativnim frekvencijama su:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 15/87
• Objašnjenje vrijednosti kumulativne
distribucije frekvencija proizilazi iz načinanjenog formiranja.
• S(x j) predstavlja broj observacijaposmatranog skupa čija je vrijednostvarijable jednaka ili manja od x j.
• F(x j) pokazuje koja je proporcija elemenataposmatranog skupa čija je vrijednost
varijable jednaka ili manja od x j.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 16/87
• Ako je data distribucija frekvencija saintervalima
S(xj) ili (Sj) predstavlja broji
F(xj) ili Fj proporciju
elemenata sa vrijednošću varijable koja je jednaka ili manja od gornje granice j-togintervala.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 17/87
Ocjena x j Frekvencije f j
6 47 8
8 7
9 6
10 9
Ukupno 34
Statistička distribucija frekvencija
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 18/87
Ocjena
xj
Frekvenci
je fj S j+ S j- pj Fj+ Fj -
6 4 4 30 0,118 0,118 0,882
7 8 12 22 0,235 0,353 0,647
8 7 19 15 0,206 0,559 0,441
9 6 25 9 0,176 0,735 0,264
10 9 34 0 0,265 1 0,000
Ukupno34 1,000
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 19/87
Kumulativne rastuće i opadajuće apsolutne
frekvencije
0
5
10
15
20
2530
35
6 7 8 9 10
Ocjene
A p s o l u t n e
f r e k v e n c i j e
Sj+ Sj-
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 20/87
Kumulativne rastuće i opadajuće relativne
frekvencije
0
0,2
0,4
0,6
0,8
1
6 7 8 9 10
Ocjene
R e
l a t i v n e f r e k v e n c i j
e
Fj+ Fj -
Grafički prikaz prekidne statističke
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 21/87
D i a g ra m s a s t u p c im a
x
f i l i p
Grafički prikaz prekidne statističkevarijable
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 22/87
F(x)
Kumulativna kriva prekidne varijable
x
Grafički prikaz neprekidne statističke
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 23/87
Histogram
x
f / a i l i p / a
Grafički prikaz neprekidne statističkevarijable
• s u a u ser e n erva no grup san
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 24/87
s u a u ser e n erva no grup sanpodataka sa jednakom amplitudom visina
pravougaonika koji čine histogram jeproporcionalna frekvenciji svakogintervala.
• Za seriju intervalno grupisanih podatakasa različitom amplitudom svakog intervalapotrebno je izračunati frekvenciju po
jedinici amplitude i u tom slučaju površinasvakog pravougaonika je proporcionalna
frekvenciji intervala.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 25/87
Kumulativna kriva
x
F
u %
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 26/87
Pitanja
1. Definišite absolutnu frekvenciju.
2. Definišite relativnu frekvenciju.
3. Definišite rastuću kumulativnu frekvenciju.4. Formalizirajte distribuciju rastuće kumulativne
frekvencije.
5. Zbog čega koristimo sintetizirane podatke?
6. Šta predstavlja izraz F(x j)?
7. Objasnite izraz
N
f p i
i =
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 27/87
Zadatak
• Odaberite primjer iz vašeg okruženja iprezentujte ga:
– na nerazumljiv način – na način koji omogućava razumijevanje informacije
koju prezentirate
• Možete raditi u grupama i svaki putkomentarisati prezentaciju druge grupe.
• Za pripremu primjera imate 3 minute.• Za prezentaciju svaka grupa ima 2 minute.
• Zajednički komentar i diskusije 3 minute.
2.4. MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 28/87
TENDENCIJE 472.4.1. Aritmetička sredina 48
2.4.1.1. Jednostavna aritmetička sredina 482.4.1.2. Ponderisana aritmetička sredina 492.4.1.3. Osobine aritmetičke sredine 502.4.2. Geometrijska sredina 532.4.3. Harmonijska sredina 542.4.4. Kvadratna i kubna sredina 552.4.5. Mod ili centar aktivnosti 562.4.6. Medijana ili centar pozicije 582.4.6.1. Određivanje medijane u uređenoj seriji 582.4.6.2. Određivanje medijane za statističku distribuciju frekvencija 592.4.6.3. Medijana i kumulativna frekvencija 602.4.6.4. Karakteristike medijane 622.4.7. Kvantili 62
2.4.7.1. Određivanje kvantila u uređenoj seriji 622.4.7.2. Određivanje kvantila u intervalno grupisanoj seriji 632.4.7.3. Kvartili 632.4.7.4. Decili 65
2.4.6.5. Centili 65
2 4 Mjere centralne tendencije ili
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 29/87
2.4. Mjere centralne tendencije ilisrednje vrijednosti
• Potpune : Aritmetička sredina,geometrijska sredina, harmonijskasredina, kvadratna sredina, kubna sredina.
• Pozicione: mod, medijana, kvantili (kvartili,decili, centili).
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 30/87
3
• Aritmetička sredina se naziva i centar gravitacije, centar koji predstavlja
prosječnu srednju vrijednost posmatraneserije.
Aritmetička sredina neuređene
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 31/87
3
)......(11
21
1
N
N
i
i x x x N x N x ++== ∑=
Aritmetička sredina neuređenestatističke serije
• Jednostavna – prosta aritmetička sredina
• {xi ; i=1,....,N} je jednaka
Aritmetička sredina uređene-rangirane
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 32/87
Aritmetička sredina uređene rangiranestatističke serije
• gdje (i) predstavlja rang observacije je jednaka:
{x(i) ; (i)=1,....,N}
)......(11 )()2()1(
1)(
)( N
N
i
i x x x N
x N
x ++== ∑=
• Aritmetička sredina statističke distribucije
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 33/87
J1,2,...., j ,; = j j f x
N x f x f x f
N
x f x J J
j j
J
j )......( 22111 ++=Σ
= =
• Aritmetička sredina statističke distribucijefrekvencija (grupisane statističke serije)Ponderisana aritmetička sredina
• Aritmetička sredina grupisane statističke
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 34/87
1 i
N
f
p jegdje
1
j
j1
∑
∑
=
=
=
== J
j
j
J
j j j
p
x p x
• Aritmetička sredina grupisane statističkeserije sa relativnim frekvencijama je jednaka:
Aritmetička sredina intervalno grupisane
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 35/87
• Aritmetička sredina intervalno grupisane
statističke serije
• gdje xc predstavlja centar intervala iizračunava se pomoću sljedećeg izraza:
N x f x f x f
N
x f
x cJ J cc
cj j
J
j )......( 22111 ++=
Σ
= =
2
1 iic
x x x += −
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 36/87
• Osobine aritmetičke ćete detaljno pročitatiu knjizi:R.Somun-Kapetanović (2008):Statistika u ekonomiji i menadžmentu,
Ekonomski fakultet Sarajevo, strane 49 i50.
Zbir odst panja i međ modaliteta i
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 37/87
3
( ) 01 =−∑=
N
ii x x ( ) 01 =−∑=
J
j j j x x f
ili
( ) 01
1
=−∑=
N
i
i x x
N
• Zbir odstupanja između modaliteta i
njihove aritmetičke sredine je jednaka nuli.
• Aritmetička sredina odstupanja izmeđumodaliteta i njihove aritmetičke sredine je
jednaka nuli.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 38/87
• !!!!! Provjerite za:
( ) 011
=−=−⋅=− ∑∑==
x N x N x N N N x x x
N
i
i
N
i
i
( ) 01
=−∑=
J
j
j j x x f
Osobina agregiranja aritmetičke
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 39/87
g g jsredine
3
21
2211
21
2211
f f
x f x f
N N
x N x N x
+
+=
+
+=
1 x2 x
N1,
N2,
N, x
Aritmetička sredina «zbira» statističkih
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 40/87
varijabli
• Ako je Z=X+Y,
aritmetička sredina varijable Z je jednaka:
y x z +=
• Aritmetička sredina linearne kombinacije
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 41/87
t et č a s ed a ea e o b ac jestatističkih varijabli
Y=aX+b
je jednaka:
3
b xa y +⋅=
Primjena
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 42/87
3
x2y
2
⋅=
⋅= X Y
5xy
5
+=
+= X Y
5x2y
52
+⋅=
+⋅= X Y
Primjena
2 4 2 Geometrijska sredina
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 43/87
2.4.2.Geometrijska sredina
• Geometrijska sredina za seriju
negrupisanih podataka je jednaka :
0 ,.... 121 >=⋅⋅⋅= ∏=
i
N
N
ii
N
N x x x x xG
• Logaritamski oblik ove funkcije je
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 44/87
• Logaritamski oblik ove funkcije je
praktičniji za primjenu:
• Logaritam geometrijske sredinevarijable X je jednak aritmetičkojsredini logaritama njenih vrijednosti.
∑==
N
i
i x N G1log
1log
• Geometrijska sredina za statističku
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 45/87
∑∑ ====
J
j
j j
J
j
j f x f N
G11
N ,log1log
∑∏ ==
==⋅⋅⋅=J
1 j j
121
f N ,....21 N
J
j
f
j
N f
J
f f j J x x x xG
jdistribuciju frekvencija je jednaka:
• Logaritamski oblik ponderisanegeometrijske sredine je:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 46/87
• Geometrijska sredina se najčešće primjenjuje uslučajevima kada se pojave ponašaju po geometrijskojprogresiji i za izračunavanje prosječnih pokazatelja
porasta i razvoja u dinamičkoj analizi pojava.
• Geometrijska sredina je manja od aritmetičke sredine za
istu seriju. Ove dvije sredine su jednake samo u slučajukada su sve vrijednosti serije međusobno jednake.
• Za izračunavanje geometrijske sredine potrebno je dasvi podaci u seriji budu pozitivni.
2 4 3 Harmonijska sredina
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 47/87
2.4.3.Harmonijska sredina
• Harmonijska sredina se definiše kaorecipročna vrijednost aritmetičke sredinerecipročnih vrijednosti varijable.
• Harmonijska sredina za neuređenu seriju
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 48/87
je jednaka:
0x,11
...1
...11 i
121
≠=
+++++
=
∑=
N
i i N i x
N
x x x x
N H
Harmonijska sredina za statističkudi ib ij f k ij
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 49/87
J
J
i
i
J i
J
j j
j
J
j
j
x
f
x
f
x
f
x
f f f f f
x
f
f
H
+++++
+++++==
∑
∑
=
=
......
......
2
2
1
1
21
1
1
distribuciju frekvencija
• Ponderisana sredina
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 50/87
• Primjenjuje se u slučajevima kada su originalni
podaci izraženi u vidu recipročnih veličina.
• Recipročne veličine se kreću u obrnutom pravcuod kretanja pojave koju izražavaju.
• Produktivnost rada je tipičan primjer primjeneove sredine.
• Produktivnost rada: veća proizvodnja uz manjiutrošak rada.
2.4.4.Kvadratna i kubna sredina
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 51/87
2.4.4.Kvadratna i kubna sredina
Kvadratna sredina Kubna sredina
31
3
3 N
x
x
N
ii
∑==
N
x x
N
ii
∑== 1
2
2
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 52/87
ii
ii
i
x x x xG H x
x xG H x
x
maxmin
maxmin
0Za
32 <<<<<<
<<<<
>
Mod ili modus Mo
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 53/87
• Mod je modalitet varijable koji se najčešćepojavljuje u analiziranoj seriji.
• Mod je modalitet varijable koji ima najveću
frekvenciju u analiziranoj seriji.
Definicija i određivanje modalne klase uinter alno gr pisanoj distrib ciji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 54/87
intervalno grupisanoj distribuciji
• To je klasa u kojoj je odnos :
frekvencija prema amplitudi najveći.
• Modalna klasa je klasa u kojoj je gustoćaposmatranja najveća.
• Tabela 11. Starosna struktura stanovništvaF d ij BiH 2007 di i
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 55/87
Federacije BiH u 2007 godini:Prave (precizne) granice intervala
Starosna struktura
u godinamau
Broj stanovnika
0-14,5 419 915
14,5-64,5 1 580 494
64,5 i više 327 950Ukupno 2 328 359
Primjer 5. Određivanje moda
• Tabela 14 Starosna struktura stanovništva Federacije
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 56/87
Starosna
struktura
Amplituda Broj
stanovnika
Gustoća
stanovnika
0-14,5 15 419 915 27994
14,5-64,5 50 1 580 494 31610
64,5 i više 26 327 950 12613
Ukupno - 2 328 359 -
• Tabela 14. Starosna struktura stanovništva Federacije
BiH u 2007 godini
Modalna klasa je klasa od 14, do 64,5
• U slučaju intervalno grupisanih distribucijalij d đi j d l kl d
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 57/87
( ) ( )3212
12
f f f f
f f a x M Mo Moo
−+−
−⋅+=
poslije određivanja modalne klase modmožemo izračunati linearnominterpolacijom korištenjem slijedeće
formule:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 58/87
• Gdje je :
– xMo lijeva granica modalnog intervala, – aMo amplituda modalnog intervala
– f 1 frekvencija prethodnog intervala, – f 2 frekvencija modalnog intervala,
– f 3
frekvencija narednog intervala.
• Relativne frekvencije: formula je analogna
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 59/87
• Relativne frekvencije: formula je analogna
prethodnoj ali koristimo pj.
• Aproksimativna vrijednost moda se možeutvrditi korištenjem slijedećeg izraza:
Mo≈3Me-2
u unimodalnim i nesimetričnimdistribucijama.
Medijana: centar pozicije
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 60/87
• Poziciona srednja vrijednost
• Medijana je vrijednost obilježja koja u
seriji uređenoj po veličini (rastućem iliopadajućem redosljedu) zauzima
centralnu poziciju (rang) i dijeli serijuna dva jednaka dijela.
• Njena teorijska kumulativna frekvencija je50%
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 61/87
50%.
• Dakle teorijski 50% podataka imavrijednost manju ili jednaku medijani ipreostala polovina podataka vrijednosti
veće od medijane.
• Za izračunavanje medijane nisu bitnevrijednosti podataka nego njihov rang.
Formalizacija:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 62/87
( ) N i x i ,.....,1)( ; =• U uređenoj seriji
medijana se računa na slijedeći način:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 63/87
2
broj paran N jeako
brojneparan N jeako
122
2
1
+
+
+
=
=
N N
N
x x
Me
x Me
Određivanje medijane u uređenojstatističkoj seriji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 64/87
statističkoj serijiBroj podataka neparan
• Uređena statistička serija od 11 podataka
24 28 30 31 34 38 39 43 44 48 50Podaci
x(i)
Rang (i) : 1 2 3 4 5 6 7 8 9 10 11
Medijana je 38
Broj podataka paran
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 65/87
• U uređenoj seriji veličine 10 :
Rang (i) : 1 2 3 4 5 6 7 8 9 10
Medijana je 36
24 28 30 31 34 38 39 43 44 48Podaci :
x(i)
2
383436
+=
• Za distribuciju frekvencija grupisanu uklase medijana se određuje linearnom
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 66/87
Me
Me
Me Me
f
S N
a xMe1
2−−
⋅+=
klase medijana se određuje linearnominterpolacijom korištenjem slijedećeformule:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 67/87
• Gdje je: – x
Me
lijeva granica medijanskog intervala,
– aMe amplituda (širina) medijanskog intervala,
– f Me frekvencija medijanskog intervala,
– SMe-1 kumulativna frekvencijapredmedijanskog intervala,
– N zbir svih frekvencija.
• Formula u kojoj koristimo kumulativnerelativne frekvencije:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 68/87
Me
Me Me Me
Me
Me Me Me
p
F a x
p
F Me F a x Me
1
1
50,0
)(
−
−
−⋅+=
−⋅+=
relativne frekvencije:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 69/87
• Gdje je: – xMe lijeva granica medijanskog intervala,
– lMe širina medijanskog intervala – FMe teorijska kumulativna relativnafrekvencija medijane,
– FMe-1 kumulativna relativna frekvencijapremedijanskog intervala,
– pMe relativna frekvencija medijanskogintervala.
Kvantili
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 70/87
• U uređenoj seriji {x(i)} kvantil reda p koji
označavamo sa xp je jednak vrijednostivarijable za koju postoji određena
proporcija p observacija koje su manje ili jednake xp i komplementarna proporcija (1-p) observacija koje su veće od x
p
*
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 71/87
10)1()( i )(
<< −>⋅≤ p
p N x F p N x F p p
10
)1()(S i )( *
<<
−>⋅≤
p
p N x p N xS p p
• Ili u apsolutnim kumulativnim frekvencijama
Određivanje kvantila u uređenoj seriji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 72/87
a) Ako u uređenoj seriji postoji vrijednost xjza koju je
• uz pretpostavku da je S=0 ako je j=1.
j
j j
x
S p N S
=
<⋅<−
p
1
x jetada
,
b) Ako u uređenoj seriji postoji vrijednost x jtakva da Sj=Np tada je vrijednost kvantila
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 73/87
j p j j
reda p jednaka
2
1++=
j j
p
x x
x
• Određivanje kvantila u intervalnogrupisanoj seriji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 74/87
q
q
qq p f
S Np
a x x1−−
⋅+=
g p j j
• Poslije određivanja kvantilne klase kvantileodređujemo korištenjem sljedeće relacije:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 75/87
• Gdje je: – xq donja granica kvantilnog intervala
– aq amplituda kvantilnog intervala – Sq-1 kumulativna frekvencija predkvantilnog
intervala – f q frekvencija kvantilnog intervala
• Formula sa kumulativnim relativnimfrekvencijama:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 76/87
q
q p
qq p p
F x F
a x x1)( −−
⋅+=
Kvartili
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 77/87
• Kvartili se označavaju sa Q1, Q2, Q3 i
predstavljaju kvantile reda p=1/4, p=1/2 ip=3/4 ili reda 25%, 50% et 75%.
• Kvartili su vrijednosti varijable koji
distribuciju uređenu po veličini dijele na 4 jednaka dijela.
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 78/87
• Tako je u uređenoj seriji prvi kvartil Q1 jednak vrijednosti varijable od koje 25%
podataka ima jednaku ili manju vrijednost,a 75% podataka ima veću vrijednost.
• Dakle 25% podataka (vrijednosti varijable)prethode Q1 i 75% podataka se nalazeposlije Q1.
• Određivanje kvartila u intervalnogrupisanoj distribuciji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 79/87
1
1
11
1
1 4Q
Q
f
S N
a xQ−−
⋅+=
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 80/87
• Gdje je: – xQ1 donja granica kvartilnog intervala
– aQ1 širina kvartilnog intervala
– SQ1-1 kumulativna absolutna frekvencija
prekvartilnog intervala – f Q1 absolutna frekvencija kvartilnog intrevala
– N proj podataka u seriji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 81/87
1
1
11
1
1
11
1
111
25,0
)(
Q
QQQ
Q
QQQ
p
F a x
p
F Q F a xQ
−
−
−⋅+=
−⋅+=
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 82/87
• Gdje je: – xQ1 donja granica kvartilnog intervala
– aQ1
širina kvartilnog intervala
– F(Q1) kumulativna relativna teorijskafrekvencija Q1
– FQ1-1 kumulativna relativna frekvencijapredkvartilnog intervala
– pQ1 relativna frekvencija kvartilnog intervala – N broj podataka u seriji
• Određivanje trećeg kvartila u intervalnogrupisanoj distribuciji
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 83/87
3
3
33
1
3 4
3
Q
Q
f
S N
a xQ−−
⋅+=
• Ili praktičnije koristeći relativnekumulativne frekvencije:
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 84/87
3
3
33
3
3
33
1
133
75,0
)(
Q
QQQ
Q
QQQ
p
F a x
p
F Q F a xQ
−
−
−⋅+=
−⋅+=
Decili
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 85/87
• Decili se označavaju sa D1, D2, ..D9 i
predstavljaju kvantile reda 10%, 20%,...,90%. Ima ih devet i dijele uređenu
statističku seriju na 10 jednakih dijelova.• Tako u uređenoj seriji, 20% observacija
prethodi D2 et 80% observacija se nalaziposlije D2.
Centili
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 86/87
• Centili se označavaju sa C1, C2, ..C95,
C99 i predstavljaju kvantile reda 1%,2%,..,95%,.. .,99%.
• Ima ih dakle 99 i dijele uređenu statističkuseriju na 100 jednakih dijelova.
• U uređenoj seriji, 1% podataka prethodiC1 i 99% podataka slijedi poslije C1
7/12/2019 Analiza i Sinteza Podataka
http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 87/87
Zaključak