Pojam, osobine i primjena Hi-kvadrat raspodjele seminarski

17
UNIVERZITET U ISTOČNOM SARAJEVU SAOBRAĆAJNI FAKULTET DOBOJ SEMINARSKI RAD PREDMET: Matematska statistika TEMA: Pojam, osobine i primjena Hi-kvadrat raspodje Mentori: Studenti: Dr Stevan Stević Snježana Radišković 121/0 Mr Vesna Mišić Jelena Božanović 133/09 Danijel Malešević 105/09

Transcript of Pojam, osobine i primjena Hi-kvadrat raspodjele seminarski

UNIVERZITET U ISTONOM SARAJEVU SAOBRAAJNI FAKULTET DOBOJ

SEMINARSKI RAD

PREDMET: Matematska statistika TEMA: Pojam, osobine i primjena Hi-kvadrat raspodjele

Mentori: Dr Stevan Stevi Mr Vesna Mii

Studenti: Snjeana Radikovi 121/09 Jelena Boanovi 133/09 Danijel Maleevi 105/09

Matematska statistika ___________________________________________________________________________

SADRAJUVOD.........................................................................................3 Hi KVADRAT TEST.............................................................4 Pojam i osobine................................................................4 Hi kvadrat test na jednom uzorku..............................6 Hi kvadrat test na dva ili vie nezavisnih uzoraka....9 Hi kvadrat test na dva zavisna uzorka......................12 NEKI OSNOVNI USLOVI ZA PRIMJENU Hi KVADRAT TESTA.....................................................................................14 ZAKLjUAK..........................................................................16

2

Matematska statistika ___________________________________________________________________________

UVOD

Hi kvadrat raspodjela se upotrebljava kada elimo utvrditi odstupanje ili opaene frekvencije od teoretskih ili oekivanih frekvencija uz odreene hipoteze. Formula za izraunavanje Hi kvadrat raspodjele:

- spada u neparametrijsku statistiku primjenjiv i kada distribucija nije normalna - primjenjivi na normalnoj mjernoj skali - rauna se samo na frekvencijama

3

Matematska statistika ___________________________________________________________________________

Hi KVADRAT TESTPojam i osobineRazlika izmeu aritmetikih sredina, neki rauni korelacije itd; mogu se primijeniti samo na kvantitativne brojane podatke, koji su ili normalno rasporeeni ili bar simetrino rasporeeni. Meutim, ako su podaci kvalitativni ili ako im distribucija znaajno odstupa od normalne, onda se veliki broj do sada opisanih postupaka ( osim rauna proporcija, nekih koeficijenata korelacije ne mogu upotrijebiti, nego se veinom upotrebljava postupak nazvan 2 test; itaj: hi kvadrat test ). Ve u poetku treba naglasiti da se hi kvadrat test rauna samo sa frekvencijama, pa, prema tome, nije doputeno u raun unositi nikakve mjerne jedinice. Osnovni podaci istraivanja dakako mogu biti i mjerne vrijednosti, ali u hi kvadrat unose se samo njihove frekvencije. Hi kvadrat test je vrlo praktian test, koji moe osobito posluiti onda kada elimo utvrditi da li neke dobivene ( opaene ) frekvencije odstupaju od frekvencija koji bismo oekivali pod odreenom hipotezom. On je esto utoliko slian raunu korelacije, to je i kod hi kvadrat testa katkada traimo postoji li povezanost izmeu dvije varijable, ali i u tim sluajevima postoji bitna razlika izmeu rauna korelacije i hi kvadrat testa, jer nam raun korelacije pokazuje stepen povezanosti izmeu dvije varijable, dok nam hi kvadrat test pokazuje vjerovatnou povezanosti.

4

Matematska statistika ___________________________________________________________________________

Gotovo se u svim sluajevima hi kvadrat izraunava na jednak nain ( uz ogranienje da katkada treba unijeti neke dodatne korelacije, ili je pak praktinije upotrebiti neku drugu formulu koja skrauje raunanje ), i to prema formuli:

Pri emu hipotezom.

f0 znai opaene frekvencije, a

ft oekivane ( teoretske

frekvencije, tj. frekvencije koje bismo oekivali pod nekom odreenom

Najee upotrebljavamo hi kvadrat test u ovim sluajevima: 1. Kad imamo frekvencije jednog uzorka pa elimo ustanoviti odstupaju li te frekvencije od frekvencija koje oekujemo uz neku hipotezu. 2. Kad imamo frekvencije dvaju ili vie nezavisnih uzoraka te elimo ustanoviti razlikuju li se uzorci u opaenim svojstvima. 3. Kad imamo frekvenciju dvaju zavisnih uzoraka koji imaju dihotomna svojstva, te elimo ustanoviti razlikuju li se uzorci u mjernim svojstvima, tj. je li dolo do promjene

5

Matematska statistika ___________________________________________________________________________

Hi kvadrat test na jednom uzorkuHi kvadrat test na jednom uzorku omoguuje provjeru: - hipoteze o sluajnoj raspodjeli - hipoteze o poznatom udjelu - hipoteze o normalnoj raspodjeli PRIMJER 1: Pretpostavimo da bacamo u zrak 100 komada novia ( ili jedan novi 100 puta ) i da smo dobili 46 glava i 54 pisma. Kao to znamo, oekivane su frekvencije 50 glava i 50 pisama. Izraunavanjem hi kvadrat testa dobiemo:

Nastavimo li bacanjem tih 100 komada novia i dalje, dobiemo i dalje esto odreene razlike izmeu broja glava i pisama a ako su novii potpuno ispravni ( tj. nemaju pojedini komadi novca tendenciju da

6

Matematska statistika ___________________________________________________________________________

preteno padaju na jednu stranu ) sigurno je da su sva takva odstupanja potpuno sluajna.

Budui da je dovoljno znati koliko je palo glava pa da time odmah znamo koliko je palo pisama ( jer su obije elije zavisne jedna od druge ) to je broj stepeni slobode jednako 1. Na slici 1. prikazana je distribucija hi kvadrata uz jedan stepen slobode, tj. distribucija rezultata koje bismo dobili kad bismo zaista bacali 100 komada novia mnogo puta. Prema tome, sve su te vrijednosti hi kvadrata sluajne. Meutim, one vrijednosti hi kvadrata koje toliko jako odstupaju od oekivanog da je njihovo sluajno pojavljivanje mogue samo u 1% ili 5% sluajeva moemo ve smatrati tolikim odstupanjem, da s pravom moemo pretpostaviti da vjerovatno nisu sluajne. Na slici 1. uz krivulju distribucije hi kvadrata uz 1 stepen slobode oznaena je na apscisi 5%tna granica iza koje povrina krivulje na desno iznosi 5%. Kako se vidi iz slike ( i iz tabele ) ta je vrijednost 3,84.

7

Matematska statistika ___________________________________________________________________________

Slika 1.

PRIMJER 2: U naem uzorku od 50 ispitanika 28 je ena, a 22 mukarca. U optoj populaciji omjer ena i mukaraca je 51:49. Postoji li izmeu nae distribucije rezultata i poznatog udjela u populaciji statistiki znaajna razlika?

8

Matematska statistika ___________________________________________________________________________

2 test = 0.32 df = 1 Granini 2 (5%) = 3.84 Granini 2 (1%) = 6.63 P>0.05 Razlika nije statistiki znaajna.

Hi kvadrat test na dva ili vie nezavisnih uzoraka-

uvijek treba unijeti frekvencije pojave nekog dogaaja, kao i broj sluajeva kod kojih se taj dogaaj nije pojavio

- teoretske frekvencije suma kolona x suma redova podijeljeno sa totalnom sumom frekvencije - df= ( broj redova 1) x ( broj kolona 1 )9

Matematska statistika ___________________________________________________________________________

PRIMJER 3: U grupi od 80 ljudi do 45 godina starosti, od upale plua obolila je 21 osoba, dok je kod starijih od 45 godina od 90 posmatranh osoba oboljelo njih 34. Zanima nas da li se navedene grupe znaajno razlikuju po broju oboljelih od upale plua.

ft

dobijemo tako da za svaku eliju pomnoimo sumu reda sa sumom

kolone i podijelimo sa totalnom sumom frekvencija:

10

Matematska statistika ___________________________________________________________________________

PRIMJER 4: elimo li uvidjeti postoji li zavisnost izmeu boje oiju sinova i oeva koristimo tzv. tablicu kontigencije. Ako rezultate unesemo u ovu tablicu, i ujedno u svaku eliju prema ve spomenutom principu ( suma reda x suma kolone podijeljeno sa ukupnom sumom ) unesemo oekivane frekvencije pod pretpostavkom da nema asocijacije izmeu boje oiju sinova i oeva, dobijamo ove rezultate ( oekivane frekvencije navedene su u zagradama ):

11

Matematska statistika ___________________________________________________________________________

Izraunavanje:

12

Matematska statistika ___________________________________________________________________________

Broj stepeni slobode = ( 4-1 ) ( 4-1 ) = 9 Iz tablice se vidi da granina vrijednost 2 uz 9 stepeni slobode, a na nivou znaajnosti od 5%, iznosti 16,919. Na je hi kvadrat znatno vei ak i od granine vrijednosti 2 na nivou znaajnosti od 1%, pa zato odbacujemo hipotezu ( tj. da nema asocijacije izmeu boje oiju sinova i oeva ) i postavljamo zakljuak da su te dvije varijable posve sigurno povezane.

Hi kvadrat test na dva zavisna uzorkaAko uporeujemo rezultate jedne te iste grupe prije i poslije ili uporeujemo istu grupu u dvije razliite aktivnosti onda vjerovatno postoji korelacija izmeu prvih i drugih rezultata. PRIMJER 5 Grupa od 100 studenata radila je dva testa. Dobijeni su sledei rezultati:

Kako se iz tablice vidi razlike izmeu prvog i drugog testa nalaze se u elijama A i D, dok su u elijama B i C navedeni samo oni koji su uspjeli ili nisu uspjeli u oba testa. Prema tome, A+D predstavlja totalni broj onih kod kojih se ne slae uspjeh prvog i drugog testa.

13

Matematska statistika ___________________________________________________________________________

Budui da A+D predstavljaju ukupan broj studenata koji su promijenili svoj uspjeh oekivali bismo pod nultom hipotezom da bi se ( A+D ) sluajeva promijenio u jednom ( A+D ) sluajeva u drugom smjeru. Drugim rijeima, pod nultom hipotezom oekivane frekvencije u eliji A iznosi ( A+D ) a jednako toliko u eliji D. Dakle:

u naem primjeru dobijamo:

Broj stepeni slobode ( 2 x 2 tablica ! ) = 1. Granina vrijednost 2 za jedan stepen slobode je 3,841, a kako je na hi kvadrat vei, odbaciemo nul hipotezu ( tj. da nema razlike u teini testova ) i zakljuiti da razlika postoji, tj. da je drugi test laki.

14

Matematska statistika ___________________________________________________________________________

NEKI OSNOVNI USLOVI ZA PRIMJENU HiKVADRAT TESTAKao to smo vidjeli, hi kvadrat test je vrlo jednostavan test jer je njegova logika jasna, a izraunavanje vrlo jednostavno. Upravo se u tome vjerovatno i krije opasnost da se njegova jednostavnost precijeni, pa se tako strunoj i naunoj literaturi greaka u primjeni statistikih postupaka nalazi upravo kod primjene hi kvadrat testa. Dok se mnogi drugi statistiki postupci daju esto primijeniti dosta mehaniki i bez posebnog opreza, kod hi kvadrat testa uvijek je potrebno dobro promisliti kako emo rezultate prikazati u tablici. Prije nego to iznesemo neke osnovne uslove, koji moraju biti ispunjeni da bi se smio raunati hi kvadrat test, naveemo jednu praktinu stranu hi kvadrata. To je test koji posjeduje tzv. aditivna svojstva, a to znai da imamo pravo izbrojiti nekoliko hi kvadrata iz istih istraivanja, i na znaajnost dobivenog rezultata zakljuivati iz tablice, s tim da saberemo i stepene slobode. PRIMJER 6: Prilikom ispitivanja kvaliteta guma izvrena su istraivanja na 5 proizvoaa guma. Dobijeno je 5 izvjetaja: 2 SAVA TIGAR MIELIN KUMHO TRAJAL 2,04 1,83 1,60 5,90 3,18

15

Matematska statistika ___________________________________________________________________________

Svi ovi rezultati su bili vezani svaki za jedan stepen slobode. Ako sve rezultate saberemo dobijamo 2 = 14,55, a na osnovu 5 izvjetaja zakljuujemo njegov statistiki znaaj ( P