Analiza i Sinteza Podataka

87
  ANALIZA I SINTEZA PODATAKA

Transcript of Analiza i Sinteza Podataka

Page 1: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 1/87

 ANALIZA I SINTEZA PODATAKA

Page 2: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 2/87

 ANALIZA I SINTEZA PODATAKA 39

• 2.1. FREKVENCIJE I KUMULATIVNE FREKVENCIJE 39

• 2.1.1. Definicije 39

• 2.1.2. Formalizacija definicija 40

• 2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI 44

• 2.2.1. Kvalitativne varijable 44

• 2.2.1.1. Kvalitativna nominalna varijabla 44

• 2.2.1.2. Kvalitativna ordinalna varijabla 45• 2.2.2. Kvantitativne varijable 45

• 2.2.2.1. Kvantitativna prekidna varijabla 45

• 2.2.2.2. Kvantitativna neprekidna varijabla 45• 2.3. GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE 45

Page 3: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 3/87

• Pročitajte sljedeći tekst:

• “Prosječan statističar je oženjen sa 1,75 žena koje čine sve što jemoguće da ga udalje od kuće 2,25 noći u sedmici sa samo 50%uspjeha.

• Nagib njegovog čela je 2%, on posjeduje 5/8 jednog računa u bancii ima 3,06 djece koji ga napola izluđuju; 1,65 od njegove djece sudječaci.

• Subotom uveče on angažuje 1/3 baby-sitter da čuva njegovo 3,06djece, u slučaju da 5/8 njegove punice koja živi sa njima u kući ne

pristane da čuva djecu za polovinu cijene.”

• T.H.Wonnacott, R.J.Wonnacott: Statistique, Economica, 3eme

edition, Paris, str.28.

Page 4: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 4/87

Diskusija o tekstu

• Na koji način je prezentovana informacija?

• Da li biste vi koristili ovakav način

prezentacije?

• Kako biste vi komentarisali ovaj tekst?

Page 5: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 5/87

 N 

 f   p i

i =

2.1. Frekvencije i kumulativne

frekvencije• Definicije

• Absolutna frekvencija je broj (učestalost)pojavljivanja jednog modaliteta i njen simbol je fi

• Relativna frekvencija je jednaka absolutnojfrekvenciji modaliteta podijeljenoj sa ukupnom

frekvencijom:

Page 6: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 6/87

• Absolutna kumulativna frekvencija Sj(može biti rastuća: ≤ i opadajuća: > )

• Relativna kumulativna frekvencija Fj(može biti rastuća: ≤ i opadajuća: > )

Page 7: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 7/87

• Kumulativna rastuća absolutna frekvencija

 jednog modaliteta je jednaka zbirufrekvencija modaliteta za koje varijabla

ima vrijednost manju ili jednaku od togmodaliteta.

• Kumulativna opadajuća absolutnafrekvencija jednog modaliteta je jednaka

zbiru frekvencija modaliteta za kojevarijabla ima vrijednost striktno veću od

tog modaliteta.

Page 8: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 8/87

• Kumulativna rastuća relativna frekvencija

 jednog modaliteta je jednaka proporcijielemenata za koje varijabla ima vrijednost

manju ili jednaku od tog modaliteta.

• Kumulativna opadajuća relativnafrekvencija jednog modaliteta je jednaka

proporciji modaliteta za koje varijabla imavrijednost striktno veću od tog modaliteta.

Page 9: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 9/87

• Prema definiciji zbir kumulativne rastućerelativne frekvencije jednog modaliteta ikumulativne opadajuće relativnefrekvencije istog modaliteta je jednak  jedinici (ili 100%).

Page 10: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 10/87

 N  f   f   f   f   x X S 

 f   f   f   x X S 

 f   f   x X S 

 f   x X S 

k  jk 

 j j

=++++=≤

+++=≤

+=≤

==

......)(

................

...)(................

)(

)(

21

21

212

11

• Kumulativnu distribuciju absolutnih

frekvencija na osnovu vrijednosti diskretnevarijable formiramo na slijedeći način:

Page 11: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 11/87

)()(S k,1,2,..., j ,)(1

 j j

 j

i

i j x X  f   x f   xS  ≤===

∑=

• j-ti član kumulativne distribucije možemo

napisati u obliku:

Page 12: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 12/87

 j

max j

max jmin

min j

x ),()(

x, 

xx ,)(0

x, 0

)(

<≤

>

≤≤≤≤

<

=

i ji

 j j

 x xS  xS 

 x N 

 x N  xS 

 x

 xS 

• Osobine kumulativne distribucije s

absolutnim frekvencijama su:

Page 13: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 13/87

)()(F k,1,2,..., j ,)(1

 j j

 j

i

i j x X  p x p x F  ≤===

∑=

• j-ti član kumulativne distribucije relativnih

frekvencija možemo napisati u obliku:

Page 14: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 14/87

 j

max j

max jmin

min j

x ),()(

x , 1

 xx ,1)(0

x, 0

)(

<≤

>

≤≤≤≤

<

=

i ji

 j j

 x x F  x F 

 x

 x x F 

 x

 x F 

• Osobine rastuće kumulativne distribucije

sa relativnim frekvencijama su:

Page 15: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 15/87

• Objašnjenje vrijednosti kumulativne

distribucije frekvencija proizilazi iz načinanjenog formiranja.

• S(x j) predstavlja broj observacijaposmatranog skupa čija je vrijednostvarijable jednaka ili manja od x j.

• F(x j) pokazuje koja je proporcija elemenataposmatranog skupa čija je vrijednost

varijable jednaka ili manja od x j.

Page 16: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 16/87

• Ako je data distribucija frekvencija saintervalima

S(xj) ili (Sj) predstavlja broji

F(xj) ili Fj proporciju

elemenata sa vrijednošću varijable koja je jednaka ili manja od gornje granice j-togintervala.

Page 17: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 17/87

Ocjena x j Frekvencije f  j

6 47 8

8 7

9 6

10 9

Ukupno 34

Statistička distribucija frekvencija

Page 18: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 18/87

Ocjena

xj

Frekvenci

 je fj S j+ S j- pj Fj+ Fj -

6 4 4 30 0,118 0,118 0,882

7 8 12 22 0,235 0,353 0,647

8 7 19 15 0,206 0,559 0,441

9 6 25 9 0,176 0,735 0,264

10 9 34 0 0,265 1 0,000

Ukupno34 1,000

 

Page 19: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 19/87

Kumulativne rastuće i opadajuće apsolutne

frekvencije

0

5

10

15

20

2530

35

6 7 8 9 10

Ocjene

   A  p  s  o   l  u   t  n  e

   f  r  e   k  v  e  n  c   i   j  e

Sj+ Sj-

Page 20: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 20/87

Kumulativne rastuće i opadajuće relativne

frekvencije

0

0,2

0,4

0,6

0,8

1

6 7 8 9 10

Ocjene

   R   e

   l   a   t   i   v   n   e   f   r   e   k   v   e   n   c   i   j

   e

Fj+ Fj -

Grafički prikaz prekidne statističke

Page 21: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 21/87

D i a g ra m s a s t u p c im a

x

   f   i   l   i  p

Grafički prikaz prekidne statističkevarijable

Page 22: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 22/87

 

F(x)

Kumulativna kriva prekidne varijable

x

Grafički prikaz neprekidne statističke

Page 23: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 23/87

Histogram

x

   f   /  a   i   l   i  p   /  a

Grafički prikaz neprekidne statističkevarijable

• s u a u ser e n erva no grup san

Page 24: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 24/87

s u a u ser e n erva no grup sanpodataka sa jednakom amplitudom visina

pravougaonika koji čine histogram jeproporcionalna frekvenciji svakogintervala.

• Za seriju intervalno grupisanih podatakasa različitom amplitudom svakog intervalapotrebno je izračunati frekvenciju po

 jedinici amplitude i u tom slučaju površinasvakog pravougaonika je proporcionalna

frekvenciji intervala.

Page 25: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 25/87

Kumulativna kriva

x

   F

  u   %

Page 26: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 26/87

Pitanja

1. Definišite absolutnu frekvenciju.

2. Definišite relativnu frekvenciju.

3. Definišite rastuću kumulativnu frekvenciju.4. Formalizirajte distribuciju rastuće kumulativne

frekvencije.

5. Zbog čega koristimo sintetizirane podatke?

6. Šta predstavlja izraz F(x j)?

7. Objasnite izraz

 N 

 f   p i

i =

Page 27: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 27/87

Zadatak

• Odaberite primjer iz vašeg okruženja iprezentujte ga:

 – na nerazumljiv način – na način koji omogućava razumijevanje informacije

koju prezentirate

• Možete raditi u grupama i svaki putkomentarisati prezentaciju druge grupe.

• Za pripremu primjera imate 3 minute.• Za prezentaciju svaka grupa ima 2 minute.

• Zajednički komentar i diskusije 3 minute.

2.4. MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE

Page 28: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 28/87

TENDENCIJE 472.4.1. Aritmetička sredina 48

2.4.1.1. Jednostavna aritmetička sredina 482.4.1.2. Ponderisana aritmetička sredina 492.4.1.3. Osobine aritmetičke sredine 502.4.2. Geometrijska sredina 532.4.3. Harmonijska sredina 542.4.4. Kvadratna i kubna sredina 552.4.5. Mod ili centar aktivnosti 562.4.6. Medijana ili centar pozicije 582.4.6.1. Određivanje medijane u uređenoj seriji 582.4.6.2. Određivanje medijane za statističku distribuciju frekvencija 592.4.6.3. Medijana i kumulativna frekvencija 602.4.6.4. Karakteristike medijane 622.4.7. Kvantili 62

2.4.7.1. Određivanje kvantila u uređenoj seriji 622.4.7.2. Određivanje kvantila u intervalno grupisanoj seriji 632.4.7.3. Kvartili 632.4.7.4. Decili 65

2.4.6.5. Centili 65

2 4 Mjere centralne tendencije ili

Page 29: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 29/87

2.4. Mjere centralne tendencije ilisrednje vrijednosti

• Potpune : Aritmetička sredina,geometrijska sredina, harmonijskasredina, kvadratna sredina, kubna sredina.

• Pozicione: mod, medijana, kvantili (kvartili,decili, centili).

Page 30: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 30/87

3

• Aritmetička sredina se naziva i centar gravitacije, centar koji predstavlja

prosječnu srednju vrijednost posmatraneserije.

Aritmetička sredina neuređene

Page 31: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 31/87

3

)......(11

21

1

 N 

 N 

i

i x x x N  x N  x ++== ∑=

 Aritmetička sredina neuređenestatističke serije

• Jednostavna – prosta aritmetička sredina

• {xi ; i=1,....,N} je jednaka

Aritmetička sredina uređene-rangirane

Page 32: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 32/87

 Aritmetička sredina uređene rangiranestatističke serije

• gdje (i) predstavlja rang observacije je jednaka:

{x(i) ; (i)=1,....,N}

)......(11 )()2()1(

1)(

)( N 

 N 

i

i x x x N 

 x N 

 x ++== ∑=

• Aritmetička sredina statističke distribucije

Page 33: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 33/87

J1,2,...., j ,; = j j f   x

 N  x f   x f   x f  

 N 

 x f   x J  J 

 j j

 J 

 j )......( 22111 ++=Σ

= =

• Aritmetička sredina statističke distribucijefrekvencija (grupisane statističke serije)Ponderisana aritmetička sredina

• Aritmetička sredina grupisane statističke

Page 34: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 34/87

 1 i

  N

  p  jegdje 

1

 j

 j1

=

=

=

== J 

 j

 j

 J 

 j j j

 p

 x p x

• Aritmetička sredina grupisane statističkeserije sa relativnim frekvencijama je jednaka:

Aritmetička sredina intervalno grupisane

Page 35: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 35/87

• Aritmetička sredina intervalno grupisane

statističke serije

• gdje xc predstavlja centar intervala iizračunava se pomoću sljedećeg izraza:

 N  x f   x f   x f  

 N 

 x f  

 x cJ  J cc

cj j

 J 

 j )......( 22111 ++=

Σ

= =

2

1 iic

 x x x += −

Page 36: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 36/87

• Osobine aritmetičke ćete detaljno pročitatiu knjizi:R.Somun-Kapetanović (2008):Statistika u ekonomiji i menadžmentu,

Ekonomski fakultet Sarajevo, strane 49 i50.

Zbir odst panja i međ modaliteta i

Page 37: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 37/87

3

( ) 01 =−∑=

 N 

ii x x ( ) 01 =−∑=

 J 

 j j j x x f  

ili

( ) 01

1

=−∑=

 N 

i

i x x

 N 

• Zbir odstupanja između modaliteta i

njihove aritmetičke sredine je jednaka nuli.

• Aritmetička sredina odstupanja izmeđumodaliteta i njihove aritmetičke sredine je

 jednaka nuli.

Page 38: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 38/87

• !!!!! Provjerite za:

( ) 011

=−=−⋅=− ∑∑==

 x N  x N  x N  N  N  x x x

 N 

i

i

 N 

i

i

( ) 01

=−∑=

 J 

 j

 j j x x f  

Osobina agregiranja aritmetičke

Page 39: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 39/87

g g jsredine

3

21

2211

21

2211

 f   f  

 x f   x f  

 N  N 

 x N  x N  x

+

+=

+

+=

1 x2 x

 N1,

 N2,

 N, x

 Aritmetička sredina «zbira» statističkih

Page 40: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 40/87

varijabli

• Ako je Z=X+Y,

aritmetička sredina varijable Z je jednaka:

 y x z  +=

• Aritmetička sredina linearne kombinacije

Page 41: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 41/87

t et č a s ed a ea e o b ac jestatističkih varijabli

Y=aX+b

 je jednaka:

3

b xa y +⋅=

Primjena

Page 42: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 42/87

3

x2y

 2

⋅=

⋅= X Y 

5xy

5

+=

+= X Y 

5x2y

 52

+⋅=

+⋅= X Y 

Primjena

2 4 2 Geometrijska sredina

Page 43: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 43/87

2.4.2.Geometrijska sredina

• Geometrijska sredina za seriju

negrupisanih podataka je jednaka :

0 ,.... 121 >=⋅⋅⋅= ∏=

i

 N 

 N 

ii

 N 

 N  x x x x xG

• Logaritamski oblik ove funkcije je

Page 44: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 44/87

• Logaritamski oblik ove funkcije je

praktičniji za primjenu:

• Logaritam geometrijske sredinevarijable X je jednak aritmetičkojsredini logaritama njenih vrijednosti.

∑==

 N 

i

i x N G1log

1log

• Geometrijska sredina za statističku

Page 45: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 45/87

∑∑ ====

 J 

 j

 j j

 J 

 j

 j f   x f   N 

G11

 N ,log1log

∑∏ ==

==⋅⋅⋅=J

1 j j

121

f  N ,....21 N 

 J 

 j

 f  

 j

 N  f  

 J 

 f   f   j J   x x x xG

jdistribuciju frekvencija je jednaka:

• Logaritamski oblik ponderisanegeometrijske sredine je:

Page 46: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 46/87

• Geometrijska sredina se najčešće primjenjuje uslučajevima kada se pojave ponašaju po geometrijskojprogresiji i za izračunavanje prosječnih pokazatelja

porasta i razvoja u dinamičkoj analizi pojava.

• Geometrijska sredina je manja od aritmetičke sredine za

istu seriju. Ove dvije sredine su jednake samo u slučajukada su sve vrijednosti serije međusobno jednake.

• Za izračunavanje geometrijske sredine potrebno je dasvi podaci u seriji budu pozitivni.

2 4 3 Harmonijska sredina

Page 47: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 47/87

2.4.3.Harmonijska sredina

• Harmonijska sredina se definiše kaorecipročna vrijednost aritmetičke sredinerecipročnih vrijednosti varijable.

• Harmonijska sredina za neuređenu seriju

Page 48: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 48/87

 je jednaka:

0x,11

...1

...11 i

121

≠=

+++++

=

∑=

 N 

i i N i x

 N 

 x x x x

 N  H 

Harmonijska sredina za statističkudi ib ij f k ij

Page 49: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 49/87

 J 

 J 

i

i

 J i

 J 

 j j

 j

 J 

 j

 j

 x

 f  

 x

 f  

 x

 f  

 x

 f   f   f   f   f  

 x

 f  

 f  

+++++

+++++==

=

=

......

......

2

2

1

1

21

1

1

distribuciju frekvencija

• Ponderisana sredina

Page 50: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 50/87

• Primjenjuje se u slučajevima kada su originalni

podaci izraženi u vidu recipročnih veličina.

• Recipročne veličine se kreću u obrnutom pravcuod kretanja pojave koju izražavaju.

• Produktivnost rada je tipičan primjer primjeneove sredine.

• Produktivnost rada: veća proizvodnja uz manjiutrošak rada.

2.4.4.Kvadratna i kubna sredina

Page 51: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 51/87

2.4.4.Kvadratna i kubna sredina

Kvadratna sredina Kubna sredina

31

3

3 N 

 x

 x

 N 

ii

∑==

 N 

 x x

 N 

ii

∑== 1

2

2

Page 52: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 52/87

ii

ii

i

 x x x xG H  x

 x xG H  x

 x

maxmin

maxmin

0Za

32 <<<<<<

<<<<

>

Mod ili modus Mo

Page 53: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 53/87

• Mod je modalitet varijable koji se najčešćepojavljuje u analiziranoj seriji.

• Mod je modalitet varijable koji ima najveću

frekvenciju u analiziranoj seriji.

Definicija i određivanje modalne klase uinter alno gr pisanoj distrib ciji

Page 54: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 54/87

intervalno grupisanoj distribuciji

• To je klasa u kojoj je odnos :

frekvencija prema amplitudi najveći.

• Modalna klasa je klasa u kojoj je gustoćaposmatranja najveća.

• Tabela 11. Starosna struktura stanovništvaF d ij BiH 2007 di i

Page 55: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 55/87

Federacije BiH u 2007 godini:Prave (precizne) granice intervala

Starosna struktura

u godinamau

Broj stanovnika

0-14,5 419 915

14,5-64,5 1 580 494

64,5 i više 327 950Ukupno 2 328 359

Primjer 5. Određivanje moda

• Tabela 14 Starosna struktura stanovništva Federacije

Page 56: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 56/87

Starosna

struktura

 Amplituda Broj

stanovnika

Gustoća

stanovnika

0-14,5 15 419 915 27994

14,5-64,5 50 1 580 494 31610

64,5 i više 26 327 950 12613

Ukupno - 2 328 359 -

• Tabela 14. Starosna struktura stanovništva Federacije

BiH u 2007 godini

Modalna klasa je klasa od 14, do 64,5

• U slučaju intervalno grupisanih distribucijalij d đi j d l kl d

Page 57: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 57/87

( ) ( )3212

12

 f   f   f   f  

 f   f  a x M   Mo Moo

−+−

−⋅+=

poslije određivanja modalne klase modmožemo izračunati linearnominterpolacijom korištenjem slijedeće

formule:

Page 58: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 58/87

• Gdje je :

 – xMo lijeva granica modalnog intervala, – aMo amplituda modalnog intervala

 – f 1 frekvencija prethodnog intervala, – f 2 frekvencija modalnog intervala,

 – f 3

frekvencija narednog intervala.

• Relativne frekvencije: formula je analogna

Page 59: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 59/87

• Relativne frekvencije: formula je analogna

prethodnoj ali koristimo pj.

• Aproksimativna vrijednost moda se možeutvrditi korištenjem slijedećeg izraza:

Mo≈3Me-2

u unimodalnim i nesimetričnimdistribucijama.

Medijana: centar pozicije

Page 60: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 60/87

• Poziciona srednja vrijednost

• Medijana je vrijednost obilježja koja u

seriji uređenoj po veličini (rastućem iliopadajućem redosljedu) zauzima

centralnu poziciju (rang) i dijeli serijuna dva jednaka dijela.

• Njena teorijska kumulativna frekvencija je50%

Page 61: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 61/87

50%.

• Dakle teorijski 50% podataka imavrijednost manju ili jednaku medijani ipreostala polovina podataka vrijednosti

veće od medijane.

• Za izračunavanje medijane nisu bitnevrijednosti podataka nego njihov rang.

Formalizacija:

Page 62: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 62/87

( ) N i x i ,.....,1)( ; =• U uređenoj seriji

medijana se računa na slijedeći način:

Page 63: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 63/87

 2

 

 broj paran N jeako

 brojneparan N jeako

122

2

1

 

 

 

 

 

 

 

 

  

  +

+

=

=

 N  N 

 N 

 x x

 Me

 x Me

Određivanje medijane u uređenojstatističkoj seriji

Page 64: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 64/87

statističkoj serijiBroj podataka neparan

• Uređena statistička serija od 11 podataka

24 28 30 31 34 38 39 43 44 48 50Podaci

x(i)

Rang (i) : 1 2 3 4 5 6 7 8 9 10 11

Medijana je 38

Broj podataka paran

Page 65: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 65/87

• U uređenoj seriji veličine 10 :

Rang (i) : 1 2 3 4 5 6 7 8 9 10

Medijana je 36

24 28 30 31 34 38 39 43 44 48Podaci :

x(i)

2

383436

+=

• Za distribuciju frekvencija grupisanu uklase medijana se određuje linearnom

Page 66: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 66/87

 Me

 Me

 Me Me

 f  

S  N 

a xMe1

2−−

⋅+=

klase medijana se određuje linearnominterpolacijom korištenjem slijedećeformule:

Page 67: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 67/87

• Gdje je: – x

Me

lijeva granica medijanskog intervala,

 – aMe amplituda (širina) medijanskog intervala,

 – f Me frekvencija medijanskog intervala,

 – SMe-1 kumulativna frekvencijapredmedijanskog intervala,

 – N zbir svih frekvencija.

• Formula u kojoj koristimo kumulativnerelativne frekvencije:

Page 68: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 68/87

 Me

 Me Me Me

 Me

 Me Me Me

 p

 F a x

 p

 F  Me F a x Me

1

1

50,0 

)(

−⋅+=

−⋅+=

relativne frekvencije:

Page 69: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 69/87

• Gdje je: – xMe lijeva granica medijanskog intervala,

 – lMe širina medijanskog intervala – FMe teorijska kumulativna relativnafrekvencija medijane,

 – FMe-1 kumulativna relativna frekvencijapremedijanskog intervala,

 – pMe relativna frekvencija medijanskogintervala.

Kvantili

Page 70: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 70/87

• U uređenoj seriji {x(i)} kvantil reda p koji

označavamo sa xp je jednak vrijednostivarijable za koju postoji određena

proporcija p observacija koje su manje ili jednake xp i komplementarna proporcija (1-p) observacija koje su veće od x

p

*

Page 71: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 71/87

10)1()( i )(

<< −>⋅≤ p

 p N  x F  p N  x F   p p

10

)1()(S i )( *

<<

−>⋅≤

 p

 p N  x p N  xS   p p

• Ili u apsolutnim kumulativnim frekvencijama

Određivanje kvantila u uređenoj seriji

Page 72: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 72/87

a) Ako u uređenoj seriji postoji vrijednost xjza koju je

• uz pretpostavku da je S=0 ako je j=1.

 j

 j j

 x

S  p N S 

=

<⋅<−

 p

1

x jetada

,

b) Ako u uređenoj seriji postoji vrijednost x jtakva da Sj=Np tada je vrijednost kvantila

Page 73: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 73/87

 j p j j

reda p jednaka

2

1++=

j j

 p

 x x

 x

• Određivanje kvantila u intervalnogrupisanoj seriji

Page 74: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 74/87

q

q

qq p f  

S  Np

a x x1−−

⋅+=

g p j j

• Poslije određivanja kvantilne klase kvantileodređujemo korištenjem sljedeće relacije:

Page 75: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 75/87

• Gdje je: – xq donja granica kvantilnog intervala

 – aq amplituda kvantilnog intervala – Sq-1 kumulativna frekvencija predkvantilnog

intervala – f q frekvencija kvantilnog intervala

• Formula sa kumulativnim relativnimfrekvencijama:

Page 76: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 76/87

q

q p

qq p p

 F  x F 

a x x1)( −−

⋅+=

Kvartili

Page 77: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 77/87

• Kvartili se označavaju sa Q1, Q2, Q3 i

predstavljaju kvantile reda p=1/4, p=1/2 ip=3/4 ili reda 25%, 50% et 75%.

• Kvartili su vrijednosti varijable koji

distribuciju uređenu po veličini dijele na 4 jednaka dijela.

Page 78: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 78/87

• Tako je u uređenoj seriji prvi kvartil Q1 jednak vrijednosti varijable od koje 25%

podataka ima jednaku ili manju vrijednost,a 75% podataka ima veću vrijednost.

• Dakle 25% podataka (vrijednosti varijable)prethode Q1 i 75% podataka se nalazeposlije Q1.

• Određivanje kvartila u intervalnogrupisanoj distribuciji

Page 79: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 79/87

1

1

11

1

1 4Q

Q

QQ

 f  

S  N 

a xQ−−

⋅+=

Page 80: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 80/87

• Gdje je: – xQ1 donja granica kvartilnog intervala

 – aQ1 širina kvartilnog intervala

 – SQ1-1 kumulativna absolutna frekvencija

prekvartilnog intervala – f Q1 absolutna frekvencija kvartilnog intrevala

 – N proj podataka u seriji

Page 81: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 81/87

1

1

11

1

1

11

1

111

25,0 

)(

Q

QQQ

Q

QQQ

 p

 F a x

 p

 F Q F a xQ

−⋅+=

−⋅+=

Page 82: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 82/87

• Gdje je: – xQ1 donja granica kvartilnog intervala

 – aQ1

širina kvartilnog intervala

 – F(Q1) kumulativna relativna teorijskafrekvencija Q1

 – FQ1-1 kumulativna relativna frekvencijapredkvartilnog intervala

 – pQ1 relativna frekvencija kvartilnog intervala – N broj podataka u seriji

• Određivanje trećeg kvartila u intervalnogrupisanoj distribuciji

Page 83: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 83/87

3

3

33

1

3 4

3

Q

Q

QQ

 f  

S  N 

a xQ−−

⋅+=

• Ili praktičnije koristeći relativnekumulativne frekvencije:

Page 84: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 84/87

3

3

33

3

3

33

1

133

75,0 

)(

Q

QQQ

Q

QQQ

 p

 F a x

 p

 F Q F a xQ

−⋅+=

−⋅+=

Decili

Page 85: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 85/87

• Decili se označavaju sa D1, D2, ..D9 i

predstavljaju kvantile reda 10%, 20%,...,90%. Ima ih devet i dijele uređenu

statističku seriju na 10 jednakih dijelova.• Tako u uređenoj seriji, 20% observacija

prethodi D2 et 80% observacija se nalaziposlije D2.

Centili

Page 86: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 86/87

• Centili se označavaju sa C1, C2, ..C95,

C99 i predstavljaju kvantile reda 1%,2%,..,95%,.. .,99%.

• Ima ih dakle 99 i dijele uređenu statističkuseriju na 100 jednakih dijelova.

• U uređenoj seriji, 1% podataka prethodiC1 i 99% podataka slijedi poslije C1

Page 87: Analiza i Sinteza Podataka

7/12/2019 Analiza i Sinteza Podataka

http://slidepdf.com/reader/full/analiza-i-sinteza-podataka 87/87

Zaključak