STATISTIKA

80
STATISTIKA Metoda uzoraka

description

STATISTIKA. Metoda uzoraka. Slučajna varijabla i distribucija vjerojatnosti. Statističke zakonitosti se očituju kada je broj mjerenja „dovoljno velik“, jer se tada relativne frekvencije stabiliziraju oko fiksnih brojeva – vjerojatnosti . - PowerPoint PPT Presentation

Transcript of STATISTIKA

Page 1: STATISTIKA

STATISTIKA

Metoda uzoraka

Page 2: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Statističke zakonitosti se očituju kada je broj mjerenja „dovoljno velik“, jer se tada relativne frekvencije stabiliziraju oko fiksnih brojeva – vjerojatnosti.

Pri izgradnji matematičkih modela statističkih fenomena polazi se od pretpostavke da je broj mjerenja beskonačno velik. U modelu se umjesto relativnih frekvencija, veličina ovisnih o broju mjerenja, koriste vjerojatnosti. Stoga se u statističkoj teoriji koriste distribucije vjerojatnosti umjesto distribucija (relativnih) frekvencija, što je činjeno u deskriptivnoj statistici.

Numerička veličina čiji oblik distribucije se analizira u deskriptivnoj statistici je statističko obilježje X, a u statističkoj teoriji slučajna varijabla X.

Page 3: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Slučajna varijabla je kvantitativna veličina, rezultat statističkog pokusa, koja može poprimiti različite vrijednosti.

Statistički ili slučajni pokus predstavlja proces promatranja ili prikupljanja podataka koji se može ponavljati u jednakim uvjetima, a rezultat se ne može sa sigurnošću predvidjeti.

Vjerojatnost je brojčana mjera nastanka slučajnih (neizvjesnih) događaja. Imaju dvije vrste vjerojatnosti, objektivna i subjektivna vjerojatnost.

Page 4: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Objektivna vjerojatnost se temelji na slučajnom uzorku koji se može ponavljati u jednakim uvjetima.

Postoje dva pristupa utvrđivanja objektivnih vjerojatnosti, klasični pristup ili a priori vjerojatnost i statistička ili a posteriori vjerojatnost.

Subjektivna vjerojatnost se temelji na osobnoj procjeni nastupanja slučajnog događaja.

Page 5: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Slučajna varijabla može biti diskretna i kontinuirana.

Diskretna varijabla poprima konačan broj izoliranih (cjelobrojnih) vrijednosti ili prebrojivo mnogo vrijednosti.

Kontinuirana (neprekidna) varijabla poprima vrijednosti iz određenog intervala. Broj vrijednosti koje može uzeti kontinuirana varijabla je beskonačan.

Page 6: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Distribucija vjerojatnosti diskretne slučajne varijable je skup uređenih parova vrijednosti, gdje prvi podatak u paru označava moguće vrijednosti slučajne varijable, a drugi podatak se odnosi na pripadajuću vjerojatnost

Svaka distribucija vjerojatnosti diskretne slučajne varijable mora ispunjavati slijedeće uvjete:

- Vjerojatnosti u distribuciji vjerojatnosti ne mogu biti negativne,

- Zbroj vjerojatnosti koje pripadaju svim vrijednostima slučajne varijable X mora biti jednak 1.

kixpx ii ,...,2,1,)(,

Page 7: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Funkcija distribucije pokazuje kolika je vjerojatnost da diskretna slučajna varijabla X poprimi neku određenu vrijednost ili manju od te vrijednosti.

Dobiva se kumuliranjem vjerojatnosti iz distribucije vjerojatnosti, slično kao što se kumulativne frekvencije dobivaju postupnim zbrajanjem apsolutnih frekvencija.

ix

ixx

ii xPxF )()(

Page 8: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Funkcija distribucije ima sljedeća matematička svojstva:

Za bilo koju vrijednost vrijedi; i ; Za vrijedi da je , što znači da je

funkcija distribucije monotono neopadajuća funkcija.

ix 1)(0 ixF

0)( F 1)( F

21 xx )()( 21 xFxF

Page 9: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Očekivana vrijednost diskretne slučajne varijable predstavlja ponderiranu aritmetičku sredinu svih mogućih vrijednosti slučajne varijable X, gdje su ponderi odgovarajuće vjerojatnosti u distribuciji vjerojatnosti. Izračunava se pomoću izraza:

Očekivana vrijednost slučajne varijable ima ista svojstva kao i aritmetička sredina numeričke varijable.U statističkim istraživanjima pojam očekivane vrijednosti slučajne varijable se poistovjećuje s aritmetičkom sredinom osnovnog skupa .

k

iii xpxXE

1

)()(

)(xE

Page 10: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Varijanca je mjera disperzije distribucije vjerojatnosti slučajne varijable. Za diskretnu varijablu X varijanca je dana izrazom:

Varijanca distribucije vjerojatnosti kao i varijanca distribucije frekvencija izražena je u kvadratnim mjernim jedinicama varijable X. Da bi se disperzija mjerila u mjernim jedinicama varijable X vadi se drugi korijen, tako se dolazi do standardne devijacije slučajne varijable X.

Relativna mjera disperzije je koeficijent varijacije, koji se dobiva kao omjer standardne devijacije i očekivane vrijednosti pomnožen sa 100

k

iii xpxXE

1

222 )()()(

k

iii xpx

1

222 )(

Page 11: STATISTIKA

Slučajna varijabla i distribucija vjerojatnosti

Mjera asimetrije distribucije vjerojatnosti je omjer trećeg momenta oko sredine i standardne devijacije podignute na treću potenciju.

Mjera zaobljenosti distribucije vjerojatnosti se dobiva kao omjer četvrtog momenta oko sredine i standardne devijacije podignute na četvrtu potenciju.

k

iii xpxMXE

1

33

3 )()( 33

M

k

iii xpxMXE

1

44

4 )()()( 44

M

Page 12: STATISTIKA

Modeli distribucije vjerojatnosti

Modeli distribucije vjerojatnosti su analitički izrazi kojima se opisuju varijacije slučajne varijable. Prikazuju se pomoću algebarskih izraza (formula) kojima se predstavlja povezanost između vrijednosti slučajne varijable i pripadajućih vjerojatnosti. Modeli distribucije vjerojatnosti se nazivaju teorijskim distribucijama vjerojatnosti

Od teorijskih distribucija diskretne slučajne varijable u primijenjenoj statistici najčešće se koriste binomna i Poissonova distribucija.

Page 13: STATISTIKA

Modeli distribucije vjerojatnosti

Kaže se da diskretna slučajna varijabla X ima binomnu razdiobu (distribuciju) s parametrima r i p i piše se X~B , ako je njezin skup vrijednosti , a pripadne vjerojatnosti mogu se odrediti pomoću formule:

)10,( pNr

),( pr rA ,...,2,1,0

xrxqpx

rxXPxp

)()(

Page 14: STATISTIKA

Modeli distribucije vjerojatnosti

Binomna distribucija je određena sa dva parametra, a to su broj r koji predstavlja broj pokusa i p – vjerojatnost uspjeha u svakom pokusu.

Pokus prema komu je definirana binomna distribucija naziva se Bernoullijev pokus, prema J. Bernoulli (1654.-1705.)

Slučajna varijabla X predstavlja broj uspjeha u nizu od r pokusa. Može uzeti cjelobrojne vrijednosti od nula (nijedan uspjeh u nizu od r pokusa) do r (uspjeh u svakom pokusu).

Page 15: STATISTIKA

Modeli distribucije vjerojatnosti

Najvažniji pokazatelji oblika binomne distribucije mogu se odrediti pomoću formula:

Očekivana vrijednost:

Varijanca:

Koeficijent asimetrije:

Koeficijent zaobljenosti:

rpXE )(

rpq

pq

rpq

pq613

rpq2

Page 16: STATISTIKA

Modeli distribucije vjerojatnosti

Poissonova distribucija je granični oblik binomne distribucije.

Kada se broj pokusa u Bernoullijevu procesu povećava, javlja se problem izračunavanja vjerojatnosti da varijabla X uzme određenu vrijednost prema formuli za binomnu distribuciju.

Francuski matematičar S.D. Poisson je 1837. godine razvio formulu prema kojoj se sa zadovoljavajućom točnosti može aproksimirati vjerojatnost iz binomne formule. Poissonova formula je:

!)(

x

exp

x

Page 17: STATISTIKA

Modeli distribucije vjerojatnosti

Za binomnu distribuciju vjerojatnosti se mogu aproksimirati navedenom formulom ako je vjerojatnost mala i ako je r veliko .

S obzirom da je p malo, kaže se da se radi o rijetkim događajima.

Slučajnu varijablu X se definira kao broj koliko puta se javio neki događaj u jedinici vremena ili prostora.

)05,0( p)50( r

Page 18: STATISTIKA

Modeli distribucije vjerojatnosti

Kažemo da slučajna varijabla X ima Poissonovu distribuciju (piše se ~ ) ako je njezin skup vrijednosti , a pripadne vjerojatnosti dane su formulom

Poissonova distribucija ima samo jedan parametar, a to je . Brojčano predstavlja prosječan broj pojavljivanja nekog događaja u jedinici prostora ili vremena

X )(Po ,...2,1,0A

!)(

x

exp

x

Page 19: STATISTIKA

Modeli distribucije vjerojatnosti

Najvažniji pokazatelji Poissonove distribucije mogu se odrediti pomoću formula:

Očekivana vrijednost:

Varijanca:

Koeficijent asimetrije:

Koeficijent zaobljenosti:

)(XE

2

1

1

3

Page 20: STATISTIKA

Distribucija vjerojatnosti kontinuirane slučajne varijable

Distribucija vjerojatnosti kontinuirane slučajne varijable opisuje razdiobu vjerojatnosti na interval vrijednosti slučajne varijable.

Kod kontinuirane slučajne varijable broj mogućih vrijednosti je beskonačan, pa nema smisla govoriti o vjerojatnosti da slučajna varijabla X poprimi neku određenu vrijednost .

Za kontinuiranu slučajnu varijablu može se odrediti vjerojatnost da ona poprimi vrijednosti iz određenog intervala.

Page 21: STATISTIKA

Distribucija vjerojatnosti kontinuirane slučajne varijable

Distribucija vjerojatnosti kontinuirane varijable određena je matematičkom funkcijom koja ima slijedeća svojstva:

Matematička funkcija kojom je određena distribucija nije nikada negativna, tj.

Ukupna površina ispod krivulje navedene

funkcije uvijek je jednaka 1,

)(xf

0)( xf

D

dxxf 1)(

Page 22: STATISTIKA

Distribucija vjerojatnosti kontinuirane slučajne varijable

Funkcija distribucije kontinuirane varijable kao i kod diskretne varijable označava vjerojatnost da slučajna varijabla poprimi određenu vrijednost ili manju od te vrijednosti. Izračunava se prema izrazu:

Vjerojatnost da slučajna varijabla bude iz intervala može se izračunati pomoću izraza:

)(xF

x

dxxfxF )()(

),( 21 xx

)()()( 1221 xFxFxXxP

Page 23: STATISTIKA

Distribucija vjerojatnosti kontinuirane slučajne varijable

Očekivana vrijednost se određuje pomoću izraza:

Disperzija se mjeri varijancom i standardnom devijacijom kao drugim korijenom iz varijance.

Koeficijent asimetrije

Koeficijent zaobljenosti

dxxxfXE

)()( )(xE

dxxfx )()( 22

dxxfxM )()( 33 3

3

M

dxxfxM )()( 44

44

M

Page 24: STATISTIKA

Modeli distribucije vjerojatnosti kontinuirane varijable

Najvažniji model teorijske distribucije vjerojatnosti uopće je normalna ili Gausssova distribucija.

Značenje ovog oblika distribucije u statističkoj teoriji i statističkim istraživanjima se ogleda u tomu što se mnoge empirijske pojave modeliraju normalnom distribucijom.

Normalni raspored je prvi otkrio 1733. godine A. de Moivre kao granični oblik binomne distribucije, tj. promatrajući što se događa sa binomnom distribucijom kada broj pokusa raste u beskonačnost. U drugoj polovici XVIII. stoljeća ovaj oblik distribucije je proučavao i P. Laplace. Godine 1809. C. Gauss i P. Laplace su potpuno opisali ovaj oblik distribucije i izveli matematičku funkciju normalne distribucije. Ovaj oblik distribucije je poznat kao Gaussova ili Gauss-Laplaceova distribucija.

Page 25: STATISTIKA

Modeli distribucije vjerojatnosti kontinuirane varijable

Za kontinuiranu slučajnu varijablu X kaže se da ima normalnu distribuciju s parametrima i (piše se X~N ), ako je njezina funkcija vjerojatnosti zadana formulom:

2 ),( 2

2

2

1

2

1)(

x

exf

Page 26: STATISTIKA

Modeli distribucije vjerojatnosti kontinuirane varijable

U navedenoj formuli veličine e i su konstante, što znači da je normalna distribucija određena parametrima - očekivana vrijednost ili aritmetička sredina i - očekivana disperzija ili varijanca.

Oblik i svojstva normalne distribucije, zbog složenosti njezine funkcije, mogu se bolje uočiti iz grafičkog prikaza.

2

Page 27: STATISTIKA

Grafički prikaz normalne distribucije

0

0,1

0,2

0,3

0,4

0,5

μ

N ( μ , σ 2 )

f(x)

x

Page 28: STATISTIKA

Normalna distribucija

Najvažnija svojstva normalne distribucije su: Normalna kriva je zvonolikog oblika, unimodalna

je i simetrična u odnosu na pravac . Aritmetička sredina, mod i medijan imaju istu

vrijednost. Definirana je od do , asimptotski se

približava x-osi, pa je njezin raspon varijacija beskonačan.

Relativna mjera asimetrije je nula, a relativna mjera zaobljenosti ima vrijednost tri.

x

Page 29: STATISTIKA

Normalna distribucija

Ukupna površina ispod krive je jednaka jedan, kao kod svake funkcije distribucije.

Vjerojatnost da slučajna varijabla, koja ima normalan oblik distribucije, poprimi vrijednost iz intervala ( , ) jednaka je:

gdje je .

1x 2x

)()()( 1221 xFxFxXxP

x

dxxfxF )()(

Page 30: STATISTIKA

Metoda uzoraka

Metoda uzoraka je dio statistike kojoj je glavni zadatak da na temelju konačnog niza podataka otkriva statističke zakonitosti i pripadne parametre promatranih statističkih fenomena.

Metoda uzoraka polazi od proučavanja odnosa između konačnog niza podataka (uzorka) i modela distribucije vjerojatnosti slučajne varijable.

Zaključci doneseni na temelju uzorka nemaju apsolutnu sigurnost, već se govori o određenoj pouzdanosti izvedenog zaključka.

Page 31: STATISTIKA

Metoda uzoraka

Osnovne zadaće statističkog zaključivanja pomoću metode uzoraka se odnose na procjenjivanje nepoznatih parametara osnovnog skupa (populacije) i na ispitivanje pretpostavki (testiranje hipoteza) o parametrima.

Da bi zaključci o karakteristikama osnovnog skupa doneseni na temelju uzorka bili valjani, uzorak mora biti reprezentativan.

Reprezentativnost uzorka se postiže odabirom odgovarajućeg načina izbora elemenata u uzorak.

Page 32: STATISTIKA

Metoda uzoraka

S obzirom na način izbora jedinica, razlikuju se slučajni i namjerni uzorci.

Namjerni uzorak se dobiva izborom jedinica za koje istraživač, prema svom osobnom uvjerenju, smatra da su tipične i reprezentativne za dani osnovni skup.

Za slučajni uzorak imamo slučajan izbor jedinica, nekom od metoda slučajnog izbora

Page 33: STATISTIKA

Metoda uzoraka

Reprezentativnost uzorka izabranog na temelju prosudbe istraživača zavisi isključivo od njegove osobne prosudbe i stručnosti.

U namjerne uzorke pored uzoraka koje istraživač bira isključivo prema subjektivnoj prosudbi, spadaju prigodni i kvotni uzorak.

Prigodni uzorak se bira ispitivanjem jednostavno dostupnih članova osnovnog skupa.

Kod kvotnog uzorka izbor jedinica određuju istraživači (anketari), ali u sklopu dodijeljene kvote.

Page 34: STATISTIKA

Metoda uzoraka

Reprezentativnost uzorka se postiže slučajnim izborom jedinica.

Za slučajne uzorke u statističkoj teoriji su razvijene metode za statističko zaključivanje o osnovnom skupu uz objektivnu procjenu prihvatljivosti takvih zaključaka.

Među slučajnim uzorcima najpoznatiji je jednostavan slučajan uzorak, a još se koriste stratificirani uzorak i uzorak skupina.

Page 35: STATISTIKA

Metoda uzoraka

Ako se iz osnovnog skupa veličine N izabire n elemenata u uzorak tako da svaki mogući uzorak ima jednaku vjerojatnost da bude izabran, onda se takav uzorak naziva jednostavan slučajan uzorak. Jednostavan slučajan uzorak može biti uzorak s ponavljanjem ili bez ponavljanja.

Izbor jedinica u uzorak iz konačnog skupa provodi se pomoću tablice slučajnih brojeva.

Tablica slučajnih brojeva predstavlja niz znamenki (ili skupina znamenki) u kojem svaka znamenka ima jednaku vjerojatnost pojavljivanja.

)( Nn

Page 36: STATISTIKA

Metoda uzoraka

Kod slučajnog izbora jedinica u uzorak može se primijeniti sistemski izbor. Za sistemski izbor mora postojati uređen popis svih statističkih jedinica.

U tablici slučajnih brojeva bira se samo početak izbora, a dalje se biraju jedinice prema koraku izbora. Ako se iz skupa od N elemenata bira uzorak veličine n članova, korak izbora predstavlja odnos N/n.

Page 37: STATISTIKA

Metoda uzoraka

Slučajan izbor jedinica u uzorak se koristi kada su jedinice osnovnog skupa relativno homogene s obzirom na karakteristike koje su predmet istraživanja.

Ako postoji značajna varijabilnost elemenata statističkog skupa, koristi se stratificirani uzorak.

Prvo se osnovni skup podijeli na homogene skupine elemenata koji se nazivaju stratumi. Iz svakog stratuma se slučajnim izborom bira određeni broj jedinica u uzorak, proporcionalno veličini stratuma.

Page 38: STATISTIKA

Metoda uzoraka

Kada je osnovni skup velik i ne raspolaže se popisom svih jedinica, može se koristiti uzorak skupina.

Osnovni skup se podijeli na skupine koje na neki način predstavljaju cjeline. Skupine se obično razlikuju po veličini, a sadrže heterogene jedinice čiji varijabilitet je sličan onom u osnovnom skupu. U uzorak se bira određeni broj skupina i to slučajnim izborom.

Page 39: STATISTIKA

Sampling distribucije

Deskriptivne mjere koje se izračunavaju pomoću vrijednosti obilježja kod svih jedinica osnovnog skupa nazivaju se parametri skupa. Najčešće korišteni parametri su aritmetička sredina , standardna devijacija i proporcija dijela statističkih jedinica koje imaju određeno svojstvo.

Deskriptivne mjere koje se izračunavaju pomoću podataka u uzorku se nazivaju statistika uzorka. S obzirom da služe za procjenu parametara osnovnog skupa nazivaju se procjenitelj.

)()( )(

Page 40: STATISTIKA

Sampling distribucije

Statistika uzorka je varijabla koja se naziva sampling-varijabla.

Najznačajnije sampling-varijable su aritmetička sredina uzoraka , standardna devijacija uzoraka (S) i proporcija uzoraka (P).

Kod procjene parametara osnovnog skupa pomoću uzorka bitno je poznavanje oblika distribucije vjerojatnosti sampling-varijable ili kraće sampling-distribucije.

)(X

Page 41: STATISTIKA

Sampling distribucije

Za sampling-distribuciju aritmetičkih sredina uzoraka vrijede pravila:

Ako je slučajni uzorak veličine n izabran iz normalno distribuiranog osnovnog skupa s aritmetičkom sredinom i standardnom devijacijom , aritmetička sredina uzoraka je slučajna varijabla s normalnim zakonom distribucije i parametrima (očekivana vrijednost) i (standardna devijacija ili standardna greška procjene aritmetičke sredine.

X

x

Page 42: STATISTIKA

Sampling distribucije

Ako je slučajni uzorak dovoljno velik i izabran iz osnovnog skupa bilo kojeg oblika distribucije promatranog obilježja s aritmetičkom sredinom i standardnom devijacijom , aritmetička sredina uzoraka teži normalnom obliku distribucije sa parametrima (očekivana vrijednost) i (standardna devijacija ili standardna greška procjene aritmetičke sredine).

)30( n

X

x

Page 43: STATISTIKA

Sampling distribucije

Ako se napravi k mogućih uzoraka veličine n iz osnovnog skupa od N elemenata, zatim se izračuna aritmetička sredina za svaki uzorak čije vrijednosti su , onda je aritmetička sredina aritmetičkih sredina svih mogućih uzoraka jednaka aritmetičkoj sredini osnovnog skupa:

kxxx ,...,, 21

k

xx

k

ii

1

Page 44: STATISTIKA

Sampling distribucije

Za odnos standardne devijacije osnovnog skupa i standardne devijacije sampling-distribucije vrijedi izraz:

Navedena relacija o odnosu standardne devijacije sampling-distribucije i standardne devijacije osnovnog skupa vrijedi za beskonačne osnovne skupove i za konačne skupove s ponavljanjem.

Izraz za standardnu grešku procjene aritmetičke sredine za konačne skupove je:

nx

1

N

nN

nx

Page 45: STATISTIKA

Sampling distribucije

Drugi važan pokazatelj osnovnog skupa je proporcija elemenata koji imaju određeno svojstvo.

Proporcija elemenata osnovnog skupa s određenim svojstvom se označava sa i predstavlja relativnu frekvenciju. Ako se elementi osnovnog skupa razvrstaju na one koji imaju traženo svojstvo i preostale elemente, onda se proporcija izračunava prema izrazu , gdje je N ukupan broj elemenata osnovnog skupa, a M broj elemenata sa zadanim svojstvom.

NM

Page 46: STATISTIKA

Sampling distribucije

Proporcija osnovnog skupa se procjenjuje pomoću uzorka. Procjenitelj je proporcija uzorka.

Proporcije uzoraka se razlikuju i predstavljaju slučajnu varijablu koja se označava sa . Za korištenje proporcije uzorka kao procjenitelja proporcije osnovnog skupa nužno je poznavanje oblika distribucije slučajne varijable

rP

rP

Page 47: STATISTIKA

Sampling distribucije

Sampling-distribucija proporcija za dovoljno velike uzorke približno je normalnog oblika, s očekivanom vrijednosti koja je jednaka proporciji osnovnog skupa, tj. , i standardnom devijacijom .

Standardna devijacija sampling-distribucije proporcija se određuje pomoću izraza:

)( rPE

rP

nP

)1(

Page 48: STATISTIKA

Sampling distribucije

Sampling-distribuciju proporcija uzorka opravdano je aproksimirati normalnom distribucijom za velike uzorke.

Praktično pravilo za definiciju velikog uzorka je ispunjavanje uvjeta: i . 5n 5)1( n

Page 49: STATISTIKA

Procjena parametara osnovnog skupa

Procjenjivanje nepoznatih parametara osnovnog skupa temelji se na podacima koji predstavljaju slučajan uzorak i na izračunu odgovarajuće statistike uzorka ili procjenitelja.

Parametri se mogu procijeniti brojem i intervalom. Izračunata vrijednost statistike uzorka je procjena

parametra brojem, a procjena intervalom se sastoji u određivanju granica raspona varijacije u kojem se prema nekom kriteriju očekuje da će biti vrijednost nepoznatog parametra.

Page 50: STATISTIKA

Procjena parametara osnovnog skupa

Interval procjene aritmetičke sredine se određuje kao interval vrijednosti oko aritmetičke sredine uzorka.

Širina ovog intervala zavisi od pouzdanosti procjene i oblika sampling distribucije aritmetičkih sredina uzoraka.

Sampling-distribucija aritmetičkih sredina uzoraka određene veličine ima normalan oblik. 12121 xx zxzxP

Page 51: STATISTIKA

Procjena parametara osnovnog skupa

Standardna greška procjene aritmetičke sredine je funkcija veličine uzorka. Za poznatu vrijednost standardne devijacije osnovnog skupa iznosi .

Međutim u praksi uglavnom nije poznata standardna devijacija osnovnog skupa, već se ona procjenjuje pomoću standardne devijacije uzorka.

Izraz za nepristranu procjenu varijance je:

nx

11

2

2

n

xxS

n

ii

Page 52: STATISTIKA

Procjena parametara osnovnog skupa

Procijenjena vrijednost standardne greške je

Standardizirana varijabla T ima oblik

tzv. Studentove ili T-distribucije sa stupnjeva slobode

Za velike uzorke sampling distribucija se može aproksimirati normalnom distribucijom

nSS x

xS

xt

)1( n

)1()( 2121 xx SzxSzxP

)1()( )1;2()1;2( xnxn StxStxP

Page 53: STATISTIKA

Procjena totala

Total T je zbroj vrijednosti numeričke varijable konačnog osnovnog skupa,

Total se može prikazati kao umnožak aritmetičke sredine i broja jedinica u statističkom skupu, .

Postupak procjenjivanja totala osnovnog skupa pomoću uzorka temelji se na istim pravilima kao i procjena aritmetičke sredine.

Procjena totala brojem dobiva se množenjem broja jedinica osnovnog skupa i aritmetičke sredine uzorka,

N

iixT

1

NT

xNT ˆ

Page 54: STATISTIKA

Procjena totala

Intervalna procjena totala uz pouzdanost se dobiva pomoću izraza:

Standardna greška procjene totala se dobiva kao umnožak standardne greške procjene

aritmetičke sredine i opsega osnovnog skupa,

Za male uzorke interval procjene je

1ˆˆ2121 TT SzTTSzTP

NSS xT xNT ˆ

1ˆˆ)1;2()1;2( TnTn StTTStTP

Page 55: STATISTIKA

Procjena proporcije

Proporcija konačnog osnovnog skupa je odnos broja članova skupa koji imaju određeno svojstvo M i ukupnog broja članova skupa N,

Proporcija osnovnog skupa na temelju podataka iz uzorka procjenjuje se brojem i intervalom.

Procjena brojem se dobiva kao omjer broja statističkih jedinica u uzorku koje imaju traženo svojstvo m i veličine uzorka n,

NM

nmp

Page 56: STATISTIKA

Procjena proporcije

Za intervalnu procjenu proporcije nužno je poznavanje oblika distribucije proporcije uzoraka .

Sampling distribucija proporcija može se aproksimirati normalnom distribucijom ako je uzorak dovoljno velik.

Kao praktično pravilo koristi se da je aproksimacija zadovoljavajuća ako je

rP

5n 5)1( n

Page 57: STATISTIKA

Procjena proporcije

Koristeći svojstva normalne distribucije interval procjene proporcije osnovnog skupa pomoću proporcije uzorka je:

Standardna greška proporcije je jednaka:

12/12/1 PP zpzpP

nP

)1(

Page 58: STATISTIKA

Procjena proporcije

Vrijednost standardne greške se ne može izračunati jer nije poznata proporcija osnovnog skupa , pa se vrši njezina procjena na temelju uzorka. Procijenjena standardna greška je:

Navedeni izraz vrijedi za uzorke s frakcijom izbora manjom od 5%, a za frakciju izbora veću od 5% koristi se faktor korekcije, pa je izraz za procijenjenu standardnu grešku:

1

)1(

n

ppSP

11

)1(

N

nN

n

ppSP

Page 59: STATISTIKA

Procjena proporcije

Zamjenom standardne greške proporcije njezinom procijenjenom vrijednosti dobiva se interval procjene proporcije osnovnog skupa uz pouzdanost .

Interval je:

12/12/1 PP SzpSzpP

1

Page 60: STATISTIKA

Procjena ukupnog broja jedinica koje imaju traženo svojstvo

Procjena ukupnog broja jedinica koje imaju traženo svojstvo pomoću proporcije uzorka je .

Procjena intervala u kojem će se kretati ukupan broj jedinica s traženim svojstvom uz pouzdanost je:

pNM ˆ

1

1ˆˆ2/12/1 MM SzMMSzMP

NpM ˆ NSS PM

Page 61: STATISTIKA

Testiranje hipoteza

Postupak testiranja hipoteza o vrijednosti nekog parametra osnovnog skupa provodi se prema precizno definiranoj proceduri. Koraci u tom postupku su:

formulacija statističke hipoteze; izbor statistike testa i određivanje njezina oblika

distribucije; određivanje razine značajnosti testa; definiranje pravila na osnovu kojeg se odlučuje o

prihvaćanju ili odbacivanju hipoteze; izbor slučajnog uzorka određene veličine i

izračunavanje statistike testa; donošenje odluke o prihvaćanju ili odbacivanju

hipoteze.

Page 62: STATISTIKA

Testiranje hipoteza

Statistička hipoteza se uvijek formulira kao nulta i alternativna.

Nulta i alternativna hipoteza predstavljaju dvije precizne, međusobno isključive tvrdnje o vrijednosti nekog parametra osnovnog skupa.

dvosmjerni test  jednosmjerni, test na gornju granicu   jednosmjerni, test na donju granicu  

00 : H 01 : H

00 : H01 : H

00 : H01 : H

Page 63: STATISTIKA

Testiranje hipoteza

Statistika testa ili test-statistika je kriterij na osnovu kojeg se provodi testiranje.

Kod testiranja pretpostavki o vrijednosti parametara osnovnog skupa , statistika testa je nepristrana procjena parametra ili neka transformacija te procjene.

Statistika testa je slučajna varijabla koja poprima određeni oblik distribucije vjerojatnosti.

Za primjer sampling-varijable aritmetičke sredine vrijedi pravilo o normalnom obliku distribucije ~ N,

20 , x

Page 64: STATISTIKA

Testiranje hipoteza

Njezina standardizirana vrijednost

za velike uzorke ima oblik jedinične normalne distribucije Z ~ N , a za male uzorke standardizirana varijabla

ima oblik T-distribucije za stupnjeva slobode.

x

XZ

0

1,0

x

XT

0

)1( n

Page 65: STATISTIKA

Testiranje hipoteza

Kod testiranja pretpostavki o proporciji osnovnog skupa, koristi se sampling-varijabla proporcija

i to za velike uzorke kada su ispunjeni uvjeti o približno normalnom obliku distribucije, približno N . Njezina standardizirana varijabla

aproksimira se jediničnom normalnom distribucijom Z ~ N .

rP

rP ,0

0

rPZ

1,0

Page 66: STATISTIKA

Testiranje hipoteza

Vjerojatnost da se odbaci istinita nulta hipoteza naziva se razina značajnosti testa ili razina signifikantnosti testa i obilježava se sa .

Veličina se naziva snaga testa i izračunava se za susjedne vrijednosti testiranog parametra , za sve veće i manje vrijednosti dok postoji preklapanje površina ispod normalne krive.

1

0

Page 67: STATISTIKA

Testiranje hipoteza

Kad se definira oblik distribucije statistike testa i odredi razina značajnosti testa, može se odrediti područje prihvaćanja nulte hipoteze.

Područje prihvaćanja nulte hipoteze može se odrediti u jedinicama obilježja X (u istim jedinicama je i sampling-varijabla), ili u standardiziranim jedinicama. Kod dvostranih testova o vrijednosti parametra gdje statistika testa ima normalni oblik, kritične granice prihvaćanja nulte hipoteze izražene u jedinicama obilježja i standardnim jedinicama su:

2/101 zc 2/102 zc

2/11 zc 2/12 zc

Page 68: STATISTIKA

Testiranje hipoteza

(1 - α )α/2α/2

Z ~ N (0,1)

-z 0 +z Područje odbacivanja Područje prihvaćanja Područje odbacivanja

Page 69: STATISTIKA

Testiranje hipoteza

-z 0

Područje odbacivanja Područje prihvaćanja

α

1 - α

Z ~ N (0 , 1)

0 z Područje prihvaćanja Područje odbacivanja

α

1 - α

Z ~ N (0 , 1)

Page 70: STATISTIKA

Testiranje hipoteza

Naredni korak kod testiranja hipoteze jest izbor slučajnog uzorka odgovarajuće veličine. Za uzorak se vrše potrebni obračuni i izračunava vrijednost statistike testa.

Donošenje odluke - Ako je statistika testa iz područja prihvaćanja nulte hipoteze, nulta hipoteza se prihvaća kao moguća, a alternativna hipoteza se odbacuje. U protivnom, kada je vrijednost statistike testa iz područja odbacivanja hipoteze, prihvatit će se alternativna hipoteza.

Page 71: STATISTIKA

Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa

Testiranje hipoteze o pretpostavljenoj vrijednosti aritmetičke sredine osnovnog skupa provodi se na osnovu slučajnog uzorka veličine n jedinica.

Statistika testa je aritmetička sredina uzoraka koja predstavlja slučajnu varijablu. Sampling-varijable aritmetičkih sredina uzoraka, odnosno njezina standardizirana vrijednost, može imati oblik normalne distribucije ili T-distribucije. U zavisnosti od oblika sampling-distribucije testiranje hipoteza o aritmetičkoj sredini osnovnog skupa provodi se pomoću z-testa ili t-testa.

Postupak testiranja hipoteze počinje postavljanjem nulte i alternativne hipoteze.

Page 72: STATISTIKA

Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa

Postavka hipoteze za dvosmjerni test

Postavka hipoteze za jednosmjerni test na gornju granicu

Postavka hipoteze za jednosmjerni test na donju granicu

00 : H 01 : H

00 : H 01 : H

00 : H 01 : H

Page 73: STATISTIKA

Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa

Statistika testa ili test veličina je sampling-varijabla aritmetičkih sredina koja ima normalni zakon distribucije, ~ N , ili standardizirana sampling-varijabla koja ima jedinični normalni oblik distribucije, Z ~ N .

Pravilo odlučivanja o prihvaćanju ili odbacivanju nulte hipoteze se postavlja u zavisnosti od oblika hipoteze i razine značajnosti testa .

X ),( 20 x

x

XZ

0

)1,0(

Page 74: STATISTIKA

Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa

Pravila odlučivanja kada je područje prihvaćanja nulte hipoteze dano u mjernim jedinicama obilježja su:

Kod dvostranog testa nulta hipoteza se prihvaća, na razini značajnosti , ako je aritmetička sredina uzorka iz intervala , gdje je

Kod jednostranog testa na gornju granicu nulta hipoteza se prihvaća kada je aritmetička sredina uzorka iz intervala , gdje je

Kod jednostranog testa na donju granicu nulta hipoteza se prihvaća kada je aritmetička sredina uzorka iz intervala , gdje je

x 21 ,cc

xSzc 2/101 xSzc 2/102

2,c xSzc 102

,1c xSzc 101

Page 75: STATISTIKA

Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa

Pravila odlučivanja o prihvaćanju ili odbacivanju nulte hipoteze kada je područje prihvaćanja dano u standardiziranim jedinicama su:

Kod dvostranog testa nulta hipoteza se prihvaća, na razini značajnosti ,kada je empirijski z-omjer po apsolutnoj vrijednosti manji od tablične z vrijednosti za vrijednost funkcije distribucije

Nulta hipoteza kod jednostranih testova na gornju

granicu se prihvaća kada je

Nulta hipoteza kod jednostranih testova na donju granicu se prihvaća kada je .

2/1

2/1 zz

1zz

1zz

Page 76: STATISTIKA

Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo

Hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo se testira na osnovu slučajnog uzorka veličine n statističkih jedinica.

Testiranje se provodi uobičajenim postupkom koji počinje postavljanjem hipoteza, nulte i alternativne.

Formulacija hipoteza zavisi od oblika testa koji odgovara polaznoj pretpostavci o proporciji osnovnog skupa.

Page 77: STATISTIKA

Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo

Dvosmjerni

Jednosmjerni, test na gornju granicu

Jednosmjerni, test na donju granicu

00 : H 01 : H

00 : H01 : H

00 : H 01 : H

Page 78: STATISTIKA

Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo

Kod testiranja hipoteze o proporciji osnovnog skupa, odgovarajuća statistika testa je proporcija uzorka. Proporcija uzorka je slučajna varijabla čiji oblik distribucije je potrebno poznavati.

Kod testiranja hipoteza koristi se standardizirana vrijednost sampling varijable , koja se dobiva pomoću izraza:

Statistika Z, pod uvjetom da je istinita, ima

jedinični normalni oblik distribucije, ~ N . Znači, kada se radi o velikom uzorku, hipoteza o proporciji se testira pomoću Z-testa.

rP

rP

P

r

S

PZ 0

0HZ 1,0

Page 79: STATISTIKA

Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo

Postupak testiranja se provodi izborom slučajnog uzorka veličine n statističkih jedinica. Za izabrani uzorak izračunava se proporcija uzorka kao omjer broja jedinica koje imaju određeno svojstvo i veličine uzorka, .

U narednom koraku se u zavisnosti od prihvaćene razine značajnosti testa određuje područje prihvaćanja nulte hipoteze. Područje prihvaćanja nulte hipoteze je:

nmp

Page 80: STATISTIKA

Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo

kod dvostranog testa interval , gdje je

kod jednostranog testa na gornju granicu interval , gdje je

kod jednostranog testa na donju granicu

interval , gdje je

21 ,cc

PSzc 2/101 PSzc 2/102

2,cPSzc 102

,1c

PSzc 101