Uvod Statisticke Metode Istrazivanja
Transcript of Uvod Statisticke Metode Istrazivanja
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
1/166
UVOD U STATISTIKEMETODE ISTRAIVANJA
SNEANA KIRIN
Statistiki nain miljenja jednog e dana za svakodnevni ivot graanapostati jednako neophodan kao znanje itanja i pisanja
Herbert George Wells(1866-1946)
Istorija i filozofija prirodnih nauka i tehnologije
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
2/166
POJAM I PREDMET
IZUAVANJA
Re statistika potie od latinske rei status-stanje
Predmet prouavanja su masovne, a nepojedinane pojave.
Na razvoj statistike su znaajno uticali razvojteorije verovatnoe, a u dananje vreme
raunari i softveri za statistiku.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
3/166
ZATO PROUAVATISTATISTIKU? U dananjem informacionom dobu svet je pun
podataka.
Postalo je pravilo da moramo usvajati i vrednovati
znatne koliine podataka (na ije dobijanje se troeogromne koliine novca) ako elimo dobiti kvalitetanuvid u tekui razvoj dogaaja.
Podacima se mora dati smisao.
Poslovne odluke se donose u okruenju u komedonosioci odluka nisu sigurni u ponaanje bitnihfaktora u budunosti.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
4/166
ETAPE U PROCESUSTATISTIKOGZAKLJUIVANJA
Izbor obeleja -iskustvenogkaraktera
Odreivanje uzorka
Sistematinosreivanje dobijenihvrednosti iz uzorka
Obrada podataka
Tumaenje rezultata
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
5/166
PODELA STATISTIKE: DESKRIPTIVNA I
INFERENCIJALNA STATISTIKADESKRIPTIVNA STATISTIKA:
Bavi se opisivanjem prikupljenih podataka dobijenih prilikom ispitivanja
ili merenja.
Sreivanje i saimanje podataka kako bi bili to pregledniji.
(npr. Grafiki prikaz, aritmetika sredina, standardna devijacija)
INFERENCIJALNA STATISTIKA:
Slui analizi uzoraka i pronalaenju pravilnosti ili razlika unutar ili meuuzorcima.
Omoguuje stvaranje zakljuaka (npr. da li se smeju generalizovatizakljuci iz konkretnog uzorka na celu populaciju).
(npr. hipoteza, otkrivanje veza meu promenljivim, modeliranje odnosa ilislinih postupaka poput analize varijanse, faktorske analize... )
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
6/166
PODELA STATISTIKE
VRSTE STATISTIKE
DESKRIPTIVNA
grafiki prikazi
analiza relativnim brojevima
srednje vrednosti
mere disperzije
mere asimetrije i zaobljenosti
meuzavisnost pojava
analiza vremenskih serija
INFERENCIJALNA
procena karakteristika
testiranje hipoteza
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
7/166
UZORKOVANJE
Teme
Promenlive(kvalitativne;kvantitativne:diskretne,
kontinualne)
Skale za merenje(nominalne, ordinalne,
intervalne i ratio)
Jaina istraivanja
Proces uzorkovanja
Tipovi uzorkovanja
Grekeuzorkovanja
Razliite populacije iz grupe ljudi
Odnos populacije i uzorka
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
8/166
Populaciju (statistiki skup) ine jedinice (stvari, osobe, poduzea,proizvodi i sl.) ija su svojstva predmet istraivanja statistikommetodom
POPULACIJA-STATISTIKI SKUP
STATISTIKISKUP
KONAAN
PREBROJIV NEPREBROJIV
BESKONAAN REALAN HIPOTETIAN
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
9/166
Podatakje statistiki izmereni kvalitativni ili kvantitativniatribut po kom su statistike jedinice u skupu sline, a ujedno semeusobno razlikuju.
Takav atribut (svojstvo) nazivamo statistikim obelejem.Varijable (promenljive)U statistici se varijabla definie sa karakteristikama: Variablaje atribut koji opisuje osobu, mesto, stvar ili ideju.
Vrednost variable moe varirati od jednog subjekta do drugog.
Definisanje statistikog skupa
Pojmovno Prostorno Vremenski
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
10/166
SKALE MERENJA
MERNE
SKALE
Nominalna Ordinarna Intervalna Ratio Vremenska
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
11/166
KVALITATIVNE I KVANTITATIVNE
VARIABLE
Variable moemoklasifikovati:
kvalitativne (kategorijske) ili
kvantitativne (numerike).
Kvalitativne promenljive uzimaju vrednosti koje predstavljaju imena ilioznake. Na primer, boja lopte (npr. crvena, zelena, plava) ili rasa pasa (npr.
doga, ovar, terijer) predstavljaju primere kvalitativnih ili kategorijskihvariabli.
Kvantitativne variable su numerike. One predstavljaju merljivu koliinu.Na primer, kada govorimo o naseljenosti grada, mi govorimo o broju ljudi ugradu - merljiv atribut grada.
U algebarskim jednainama, kvantitativne variable su prezentovane
simbolima (na pr. x, y, ili z).
Varijable
Kvantitativne
kontinuirane
diskretne
Kvalitativne
SKALE MERENJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
12/16612
Nominalna skala merenja jedino zadovolavasvojstvoidentifikacije.
Vrednostidodelenepromenlivepredstavlaju opisnukategoriju, ali nema nikakve numerike vrednosti u vezi sa
veliinom.
Primeri: polje primerpromenlivekoja se meri na nominalnojskali. Pojedinci mogu biti klasifikovani kao "muko" ili"ensko", ali nijedna vrednost nepredstavlavieili manje "rod"
od drugog. Religija i politikapripadnost su takodje primerivarijabli koje se obinomere na nominalnoj skali.
SKALE MERENJA:
NOMINALNA SKALA MERENJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
13/16613
Ordinalna skalaima dva svojstva: identitet i veliinu. Svakavrednost u rednoj skali ima jedinstveno znaenjei ima ureena
odnos prema svakoj drugoj vrednosti.
Primer redne skale je rezultat trke Formule 1 gde dobijamo
identitet i redno mesto uesnikau trci. U ovoj skali se zna ko jeispred koga (ali ne i za koliko, 100m ili 2 kilometra).
ORDINALNA (REDNA) SKALA
MERENJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
14/16614
I ntervalna skala merenja ima svojstva: identitet, veliina i jednaki
intervali.
Primer intervalne skale je Celzijusova skala za merenje temperature.
Skala se sastoji od jednakih temperaturnih jedinica, tako da je razlika
izmeu40 i 50 stepeni Celzijusa jednaka razlici izmeu50 i 60stepeni Celzijusa.
Sa intervalnom skalom se ne zna samo da li su razliitevrednosti veeili manje, vese i takoezna i koliko su one veeili manje. Na
primer, pretpostavimo da je u ponedeljak bilo 15 stepeni Celzijusa, a u
utorak 25 stepeni. Zna se, ne samo da je u utorak bilo toplije, zna se da
je bilo 10 stepeni toplije. Pored toga, nula nepredstavlaapsolutnu najniuvrednost. Umesto
toga, to je takana skali sa brojevima iznad i ispod nje (na primer, -10stepeni Celzijusa).
INTERVALNA SKALA MERENJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
15/16615
Ratio skala nosi ime po injenici da je merenje procena odnosaizmeuveliinekontinuirane koliineijedinineveliineiste vrste(Michell, 1997, 1999). Skala odnosa poseduje smislenu
(jedinstvenu i ne-proizvolnu) nultu vrednost.
Ratio skala zadovolavasve etirisvojstva merenja: identitet,veliinu, jednake intervale i apsolutna nula.
Primer Ratio skale je teinaobjekta. Svaka vrednost na skaliteineima jedinstveno znaenje, teinese mogu redno prikazati,
jedinineteinena skali su jednake, a tu je apsolutna nula. Apsolutna nula je svojstvo skale teinejer predmeti u mirovanju
mogu biti ubesteinskomstanju, ali oni ne mogu imati negativanteinu.
RATIO SKALA(SKALA MERENJE RAZMERE)
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
16/16616
SKALE MERENJA
Nominalna
Identitet (deskriptivnakategorija)
Ordinalna
Identitet i jaina
Intervalna
Identitet, jaina i jednakiintervali
Ratio skalaIdentitet, jaina, jednaki intervalii apsolutna nula
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
17/16617
Jednodimenzioni podaci. Kada se sprovede studija koja posmatra
samo jednupromenlivu, kaese da se radi sa univariatnimpodacima.
Primer: sprovodi se anketa za procenuprosenepotronjegorivarazliitih automobila. Poto se radi samo o jednojpromenlivoj(zapremini), smatra se da se radi sa univariatnim podacima.
Dvodimenzioni podaci. Kada se sprovodi studija koja istraujeodnos izmeudve varijable, radi se sa bivariatnim podacima.
Na primer, pretpostavimo da se sprovodi studija sa ciljem da seodredi odnos izmeuteinevozila ipotronjegoriva. Potose radisa dvepromenlive( teinai zapremina), kaese da se radi sa
bivarijatnim podacima.
JEDNODIMENZIONI I
DVODIMENZIONI PODACI
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
18/16618
UZORKOVANJE
Teorija uzorkovanjaprouavaodnos izmeuneke populacije iuzorka izvuenogiz nje.
Takve informacije se zatim
koriste za procenu parametarakao tosu srednja vrednost
populacije i varijansa.
Populacija
Uzorak
Uzorkovanje Zakljuivanje
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
19/16619
Uspenastatistikapraksa se zasniva na fokusiranoj
definiciji problema. U uzorkovanju, to podrazumevadefinisanje populacije iz koje se uzorak uzima.
Populacija se moedefinisati kao skup svih ludiiliartikala sa karakteristikom koja se elirazumeti. Zato
tou praksi veoma retko ima dovolnovremena ilinovca da se prikupe informacije iz svih ili svega upopulaciji, cilpostajepronalaenjereprezentativnoguzorka (ili podskup) od te populacije.
Uzorkovanje se, kao deo statistikeprakse, baviizborom podskupa pojedinaca iz populacije da se dobijeneko znanje o celoj populaciji, a posebno za potrebeizrade prognoze na osnovu statistikogzakluivanja.
DEFINICIJA PROBLEMA
OKVIR UZORKA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
20/16620
Obinose okvir uzorka postavlja tako da se moeidentifikovati svaki element i ukluiti u uzorak.
Najjednostavniji tip okvira je spisak elemenata
populacije (poelnoje cele populacije) saodgovarajuimkontakt informacijama.
OKVIR UZORKA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
21/16621
Merljivo svojstvo populacije, kao srednja vrednost ili
standardna devijacija se zovu parametri populacije, ali
merljive karakteristike uzorkase zovu statistike.
Srednja vrednost populacije se oznaava sa; a srednja vrednostuzorka sa .
Formula za standardnu devijaciju populacije je razliita od
formule za standardnu devijaciju uzorka.
POPULACIJA I UZORAK
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
22/16622
Probabilistiko uzorkovanje Uzorkovanje metodom sluajnog izbora
Sistematino uzorkovanje
Stratificirano uzorkovanje Probabilistiko uzorkovanje proporcionalno veliini
Uzorkovanje klastera
TIPOVI UZORKOVANJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
23/16623
Probabilistiko uzorkovanjeje takvo uzimanje uzorka prikome svaka jedinica u populaciji ima ansu(veu od nule) da
bude uzeta u uzorak i ta verovatnoa moe da se tano odredi.
Ovaj nain uzorkovanja je bilo koji metod koji koristi neki oblik
sluajnogizbora. Da bi imali sluajadnmetod selekcije, potrebno je da se podesi
proces ili postupak tsko da se osigura da razliitejedinicepopulacije imaju jednake verovatnoe da budu izabrane.
Ljudi su dugopokuavalida generiurazne oblike sluajnogizbora, kao tosu branje imena iz eira, ilibirajuinajkrauslamku. Ovih dana se koriste kompjuteri kao mehanizam zagenerisanje sluajnihbrojeva i kao osnov za metodu sluajnogizbora.
PROBABILISTIKO UZORKOVANJE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
24/16624
Kada svaki element u populaciji ima istu verovatnouselekcije, kae se da je u pitanju"dizajn sa jednakomverovatnoomselekcije(sve izabrane jedinice imaju istu teinu).
Verovatnoauzorkovanja obuhvata: princip sluajnoguzorka,
sistematinouzorkovanja, stratifikovano uzorkovanje,uzorkovanje sa verovatnoomproporcionalnoj veliiniuzimanja uzorka, i klaster uzorkovanje.
Ovi razliitinainiprimene verovatnoeuzorkovanja imaju dve
zajednikestvari:
Svaki element ima poznatu verovatnou(veuod 0) i
Ukluujesluajniizbor u nekom trenutku.
PROBABILITISTIKOUZORKOVANJE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
25/166
25
Uzorkovanje metodom sluajnog izbora je metoduzorkovanja koji ima sledea svojstva:
Populacija se sastoji od Nobjekata.
Uzorak se sastoji od nobjekata.
Svi mogui uzorci od nobjekata su jednako verovatni.Glavna prednost prostog uzorkovanja na sluajan nain je dagarantuje da je izabran uzorak reprezentativan za populaciju. To
obezbeuje validnost statistikog zakljuivanja.
UZORKOVANJE METODOM
SLUAJNOG IZBORA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
26/166
26
Princip sluajnoguzorka moebiti ranjiv na grekeuzorkovanja,
jer sluajnostselekcije moedovesti do toga da neki uzorak neodraavasastav populacije.
Na primer, jednostavan sluajniuzorak od deset ludiiz nekezemleeu proseku imati pet mukaracai pet ena, ali je
verovatno da dosta pojedinanihuzoraka imaju vei/manji brojmukaraca/enaod 5. U ciljuprevazilaenjaovog problemakoriste se sistematsko uzorkovanje i stratifikacija.
Princip sluajnoguzorka takoemoebiti glomazan i naporan
kada se radi uzorkovanje od neobinovelike populacije.
U nekim sluajevima, istraivaisu zainteresovani zaistraivakihpitanja specifinaza podgrupe populacije.
UZORKOVANJE METODOM SLUAJNOGIZBORA - NEDOSTACI
SISTEMATINO UZORKOVANJE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
27/166
27
Sistematino uzorkovanje se sprovodi tako to se elementi
populacije biraju u odreenim intervalima po utvrenoj emi. Sistematino uzorkovanje ukljuuje sluajan poetaki nastavlja
izborom svakog sledeeg k-togelementa. Ovde je, broj jedinica uuzorku, k=(veliinapopulacije/veliina uzorka). Vano je da
poetna taka nije prva na listi, ve se sluajno bira. Jednostavanprimer je biranje svakog10-tog imena u telefonskom imeniku .
Sve dok je poetna taka sluajna , stematino uzorkovanje je tipprobabiliti uzorkovanja.
SISTEMATINO UZORKOVANJE
UZORKOVANJE STRATIFIKACIJOM
http://en.wikipedia.org/wiki/Probability_samplinghttp://en.wikipedia.org/wiki/Probability_samplinghttp://en.wikipedia.org/wiki/Probability_sampling -
7/23/2019 Uvod Statisticke Metode Istrazivanja
28/166
28
Kada stanovnitva obuhvata razliite kategorije, one
se mogu organizovati po tim kategorijama u odvojene"slojeve".
Svaki sloj je tada odabran kao samostalna sub-populacija, od kojih pojedini elementi mogu biti
nasumino odabrani. Postoji nekoliko potencijalnihprednosti slojevitog uzorkovanja.
Uzorkovanje proporcionalno veliini
Uzorkovanje ija je verovatnoa proporcionalnaveliini se izvodi tako da je verovatnoa izbora svakogelementa proporcionalna njegovoj veliini.
UZORKOVANJE STRATIFIKACIJOM
KLASTER UZORKOVANJE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
29/166
29
Ponekad je po ceni efektivnije grupisati elemente u groupe
(klastere') po geografskom principu ili periodu vremena.(Skoro svi uzorci su u nekom smislu klasterisani' u vremenumada se to retko uzima u obzir u toku analize)
KLASTER UZORKOVANJE
Grad
Blok 1 Blok 2 Blok 3
Zgrada 1 Zgrada 2
Populacija
Nivo klastera
Elementarni nivo
http://en.wikipedia.org/wiki/Sampling_framehttp://en.wikipedia.org/wiki/Sampling_framehttp://en.wikipedia.org/wiki/Sampling_framehttp://en.wikipedia.org/wiki/Sampling_frame -
7/23/2019 Uvod Statisticke Metode Istrazivanja
30/166
DESKRIPTIVNA
STATISTIKA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
31/166
31
Vana primena deskriptivne statistike je da sumirasakupljene podatke na jasan i razumljiv nain.
Deskriptivna statistika se primenjuje da opie osnovnasvojstvapodataka koji se analiziraju.
Zajedno sa jednostavnim grafikim prikazom/analizom, onadaje i osnovnu kvantitativnu analizu podataka.
Pojam deskriptivne statistike
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
32/166
MERA CENTRALNE
TENDENCIJE
Fundamentalni zadatak u velikom broju statistikih analiza jeodreivanje lokacije i varijabilnosti skupa podataka.
SREDNJA VREDNOST
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
33/166
SREDNJA VREDNOSTGlavna deskriptivna (opisna) kvantitativna vrednost izvedena iz
podataka uzorka je sredina, koja predstavlja aritmetiki prosek
podataka uzorka. Ona se koristi kao najpouzdanija pojedinanamera vrednosti tipinog lana uzorka.
Sredina populacije,
Sredina uzorka= gde
o Xje suma svih obeleja populacije.o Nje broj obeleja populacije.o xje suma obeleja uzorkai nje broj obeleja u
uzorku.
Kada statistiari govore o sredini populacije koriste grkoslovo . Kada govore o sredini uzorka koriste oznaku
.
MEDIJANA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
34/166
MEDIJANA
Ako uzorak sadri nekoliko vrednosti koje su toliko velike ilitoliko male da imaju iskrivljujui efekat na vrednost sredine, onse moe predstaviti tanije korienjem medijane vrednostikoja sve vrednosti uzorka deli na dve jednake polovine.
Postupak odreivanja mediane posmatrana obeleja seporeaju od najmanje do najvee vrednosti . Za neparan brojopservacija, mediana je srednja vrednost. Za paran broj
opservacija mediana je sredina dve srednje vrednosti:
NEPARAN BROJ OPAANJA :
MEDIANA=(N+ 1)/2
PARAN BROJ OPAANJA:
MEDIANA= [(N/2) + ((N/2) +1)]/2
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
35/166
MOD
Mod je vrednost koja se najee pojavljuje u skupupodataka.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
36/166
PRIMER 1
Pretpostavimo da imamo uzorak od 5-oro dece imerimo njihovu visinu. Izmerene visine su:
100 cm, 100 cm, 130 cm, 140 cm i 150 cm.
Vrednost mediane je130 cm; jer imamo 5posmatranja, a 130 cm je srednja visina;
Srednja visina= (100 + 100 + 130 + 140 + 150)/5 =
620/5 = 124 cmMod=100 cm (dva puta)
Sredina nasuprot mediani
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
37/166
Sredina nasuprot mediani
Svaka od njih ima prednosti i nedostatke:
Medijana moe biti bolji pokazatelj tipinevrednosti u sluaju kada imamo ekstremne
izuzetke.
Meutim, kada imamo veliki uzorak koji neukljuuje izuzetke,srednja vrednost pokazuje
bolju meru centralne tendencije.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
38/166
PRIMER 2
Ilustracija: Pretpostavimo da posmatramo
uzorak od 10 porodica i zanima nas tipiniprihod porodice. Devet porodica imaju prihod
izmeu 50.000 and 100.000 din; ali deseta imameseni prihod od 1.000.000 din. Desetaporodica je ekstremna vrednost (izuzetak). Ako
mi procenjujemo prihod tipinog domainstvaonda e srednja vrednost znatno premaivatiprihod tipinog domainstva, a medijana nee.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
39/166
MERENJE DISPERZIJE
Koliine najee koriene za merenje rasipanja(disperzije) vrednosti oko njihove sredine su varijansa 2i njen kvadratni koren, standardna devijacija .
Varijansa se izraunava odreivanjem sredine, njenimoduzimanjem od svake vrednosti u uzorku (to dajeodstupanje-devijaciju uzoraka), a potom nalaenjem
proseka kvadrata ovih odstupanja.
VARIJANSA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
40/166
VARIJANSA
U populaciji , variansaje srednje kvadratno odstupanje od sredine
populacije definisana formulom :
gde je 2variansa populacije, je srednja vrednost populacije, Xije
i-ti element populacije i N je broj elemenata populacije.
Varijansa uzorka se definie neto drugaijom formulom :
gde je s varijansa uzorka, je sredina uzorka, je i-ti element izuzorka i nje broj elemenata u uzorku. Formula za varijansu uzorka
moe da se posmatra kao nepristrasna procena varijanse pop ulacije.
2= ( Xi- )2/ N
s2= ( xi- )
2/ ( n - 1 )
STANDARDNA DEVIJACIJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
41/166
STANDARDNA DEVIJACIJA
Standardna devijacija populacijeje kvadratni koren izvarianse:
()
gde je standardna devijacija populacije, 2je varijansa
populacije, je srednja vrednost populacije,
je i-ti
elemenat populacije i N je broj elemenata u populaciji.
Standardna devijacija uzorkaje:
( )
1
gde jes- standardna devijacija,s2je variansa uzorka, je
sredina uzorka, je i-ti element uzorka i nje brojelemenata u uzorku.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
42/166
SREDNJA VREDNOST I
STANDARDNA DEVIJACIJA
Sredina i standardna devijacija uzorka koriste se kao
procene odgovarajuih karakteristika celokupnegrupe iz koje je uzorak izvuen.
GRAFIKI PRIKAZ KUMULATIVNE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
43/166
GRAFIKI PRIKAZ KUMULATIVNEFREKVENCIJE
Grafikiprikaz kumulativne frekvencijejenainda sese prikau kumulativne informacije grafiki. On
prikazuje broj, procenat ili proporciju elemenataposmatranog skupa koja je manja ili jednaka nekoj
vrednosti.
Primer: U skupu podataka kumulativna frekvencijaza vrednostx je ukupan broj zbirova koji su manji ili
jednaki x. Slika na sledeem slajdu ilustruje razlikuizmeu frekvencije i kumulativne frekvencije. Obagrafa pokazuju zbirove testa za 300 studenata.
PRIMER 3
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
44/166
PRIMER 3
Visine kolona levog grafa, pokazuju frekvenciju - brojstudenata u svakoj grupi po rezultatu u testiranju. Npr.,oko 30 studenata je dobilo izmeu51 i 60 poena natestu.
Visine kolona desnog grafa pokazuju kumulativnufrekvencijubroj studenata do svakog zbira poena kojise posmatra. On pokazuje da je 30 studenata dobilo natestu do 50 poena; 60 studenata je dobilo rezultat do 60
poena; 120 studenata je dobilo rezultat do 70poena itd.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
45/166
APSOLUTNA NASUPROT RELATIVNOJ
FREKVENCIJI
Frekvencija se moemeriti apsolutnim ili
relativnim brojevima
(proporcija-gornji
graf ili procenat-
donji graf).
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
46/166
DISKRETNA PROMENLJIVA-
VARIJANSA
Za diskretnu varijablu Xvarijansa je data izrazom:
k
iii xpxXE 1
222
)()()(
k
iii xpx1
222
)(
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
47/166
KONTINUALNE PROMENLJIVE
Ovde graf prikazujekumulativni graf kontinualne
promenljive na X osi
Odredjivanje mediane:
Posmatra se linija koja ide odY ose za 50%. Ta linija seekrivu nad X osom (vrednostzbira testa) za vrednost 73. Toznai da je polovina studenata
dobila rezultat testa do 73poena i polovina najmanje 73poena.
Prema tome, mediana je 73.
DESCRIPTIVNE STATISTIKE ANALIZE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
48/166
DESCRIPTIVNE STATISTIKEANALIZEDescriptivne statistikeanalize predstavljaju skup metoda koji sekoriste za prikaz i opis osnovnih karakteristika statistikog skupa.
Odreivanje osnovnih statistikih indikatora ukljuuje:
1. Grupisanje i sortiranje podataka.2. Prikaz statistika.
3. Odreivanje osnovnihindikatora statistikihserija.
Grupisanje podataka se vri prema vrednosti ili modalitetu koji seistrauje.
Prikazivanje statistikihserija moe biti uraeno na dva naina: tabelarno. grafiki.
SIMETRIJA I SPLJOTENOST
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
49/166
SIMETRIJA I SPLJOTENOST(SKEWNESS AND KURTOSIS)
Skewnessje mera simetrije ili, preciznije, nedostataksimetrije. Distribucija skupa podataka je simetrina ako izgledaisto levo i desno od centralne vrednosti.
Kurtosisje mera da li su podaci otrije ili spljotenije
rasporeeni u odnosu nanormalnu distribuciju.To znai da skup podataka kod koga je kurtosis veliki imaznaajanpikblizu srednje vrednosti, naglo opadajui i ima dugerepove.
Skup podataka sa malim kurtosisom ima ravan vrh blizu sredine.(Uniformna distribucija je ekstreman sluaj).
SKEWNESS
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
50/166
SKEWNESS
Za skup podataka Y1. Y2. .... YN, formula for
skewness je:
( )=
(1)
gde je srednja vrednost, sje the standardna devijacija iNje brojelemenata. Skewness za normalnu distribucijuje nula i svaki simetrian skup
podataka ima skewness blizu nule.
Negativne vrednosti za skewness ukazuju podatke koji su
iskrivljeni nalevo, a pozitivne vrednosti za skewness ukazuje dasu podaci iskrivljenina desno.
Iskrivljenost na levo znai da je levi rep dui u odnosu na desni.Slino,iskrivljenost na desno znai da je desni reprelativno dui u
odnosu na levi.
http://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htm -
7/23/2019 Uvod Statisticke Metode Istrazivanja
51/166
KURTOSIS
( )=(1)
Gde je
srednja vrednost, s je standardna devijacija iNje
broj podataka. Kurtosis za standardnu normalnu distribuciju
je 3. Iz tog razloga, neki analitiari koriste sledeudefiniciju za kurtosis :
()
() -3
http://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htm -
7/23/2019 Uvod Statisticke Metode Istrazivanja
52/166
KURTOSIS
Ta definicija se koristi sa ciljem da oznai dastandardna normalna distribucija ima kurtosis
nula.
U tom sluajupozitivan kurtosis ukazujedistribuciju sa pikom, anegativan kurtosisukazuje da se radi o ravnijoj distribuciji.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
53/166
PRIMERI ZA SKEWNESS I KURTOSIS:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
54/166
SKEWNESS
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
55/166
Primer 4-tabela
Broj ispita (X) Broj studenata (fi)
0-2 10
3-5 20
6-8 15
9-11 12
posmatrano svojstvo Frekvencija (fi),
X- kvalitativna strana kvantitativna strana tabel
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
56/166
TIPOVI GRAFOVA:
Grafovi se obino delena: Skater (Scatter) Stubiasti (Bar)
Linijski (Line diagram)Pita- graf (Pie chart)
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
57/166
SKATER GRAF
Number of exams
0
5
10
15
20
25
0 2 4 6 8 10 12
Number of students
Number of students
B dij
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
58/166
Bar dijagram
0
5
10
15
20
25
0-2 3-5 6-8 9-11
Broj studenata (fi)
Number of students (fi)
U Excelu
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
59/166
59
U Excelu
Broj ispita Broj studenata
1 10
4 207 15
10 12
umber of exam Number of students
Mean 5,5 Mean 14,25Standard Error 1,936491673 Standard Error 2,174664725
Median 5,5 Median 13,5
Mode #N/A Mode #N/A
Standard Devi 3,872983346 Standard Devia 4,34932945
Sample Varian 15 Sample Varianc 18,91666667
Kurtosis -1,2 Kurtosis -0,036561936
Skewness 0 Skewness 0,829536957
Range 9 Range 10
Minimum 1 Minimum 10Maximum 10 Maximum 20
Sum 22 Sum 57
Count 4 Count 4
PRIMER5
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
60/166
PRIMER5
MesecBroj turista (uhiljadama)
Januar 20
Februar 18
Mart 21
April 35
Maj 40
Jun 95
Jul 75
Avgust 78Septembar 41
Octobar 45
Novembar 34
Decembar 18
Broj turista(u hiljadama)
January
February
March
April
May
June
July
August
September
October
November
December
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
61/166
LINIJSKI DIJAGRAM
0
10
20
30
40
50
60
70
80
90
100
Broj turista (u hiljadama)
Number of tourists (in thousands)
POLARNI DIJAGRAM (TIP LINIJSKOGDIJAGRAMA)
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
62/166
DIJAGRAMA)
0
10
20
30
40
50
60
70
80
90
100
January
February
March
April
May
June
July
August
September
October
November
December
Series1
PITA GRAF
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
63/166
PITA GRAF
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
64/166
PRIMER: SREDNJA VREDNOST (EXCEL)
MesecBroj turista(u hiljadama)
Januar 20
Februar 18
Mart 21
April 35
Maj 40
Jun 95
Jul 75
Avgust 78
Septembar 41
Oktobar 45
Novembar 34
Decembar 18
Sum 520
The mean 43,33333333
The mean 43,33333333
Srednja vrednost= (xi)/n
=520/12= 43.3
Srednja vrednost =
Average(b2:b12)=43.3
Minimum=min(b2:b12)=18
Maximum=max(b2:b12)=92
Range=Maximum-minimum=77
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
65/166
65
Histogram in Excel:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
66/166
66
Output
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
67/166
PRIMER: MEDIANA
MonthsNumber of tourists(in thousands)
December 18
February 18
January 20
March 21
November 34
April 35
May 40
September 41
October 45
July 75August 78
June 95
Sortira vrednosti
prema veliini
Mediana=
(f6+f7)/2=(35*40)/2
=37.5
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
68/166
VARIANSA I STANDARDNA DEVIJACIJA
Mesec
Broj turista
(u hiljadama)
(Xi-Xaverage)**2
Januar 20 544,4444444
Februar 18 641,7777778
Mart 21 498,7777778
April 35 69,44444444
Maj 40 11,11111111
Jun 95 2669,444444Jul 75 1002,777778
Avgust 78 1201,777778
Septembar 41 5,444444444
Oktobar 45 2,777777778
Novembar 34 87,11111111
Decembar 18 641,7777778Sum 520 7376,666667
The mean 43,33333333
The mean 43,33333333
Variance 670,6060606
StDev 25,89606265
Variance=
Sum(Xi-Xsr)**2/(n-1)
Or
Excel function
Var(x1:x12)=
670.606
StDev=SQRT(Varian
ce)
or
Excel function:
STDEV(x1:x12)=25.89606265
EXCEL REZULTATI ZA PRIMER 5
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
69/166
EXCEL REZULTATI ZA PRIMER 5:
DATA ANALYSIS. DESCRIPTIVE STATISTIC
Months
Number of tourists
(in thousands)
January 20
February 18
March 21
April 35May 40
June 95
July 75
August 78
September 41October 45
November 34
December 18
Number of tourists (in thousands)
Mean 43.33333333
Standard Error 7.47554937
Median 37.5
Mode 18
Standard Deviation 25.89606265
Sample Variance 670.6060606
Kurtosis -0.193982443
Skewness 0.964520362
Range 77
Minimum 18Maximum 95
Sum 520
Count 12
Confidence Level(95,0%) 16.45357323
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
70/166
SKEWNESS AND KURTOSIS (IN EXCEL)
Skewness = SKEW(B2:B13)= 0.964520362
Pozitivna vrednost za skewness ukazuje da su podaci zakrivljeni
udesno.
Kurtosis = Kurt(B2:B13)= -0.193982443
Prema drugoj definiciji (normalna distribucija ima=0 negativni
kurtosis ukazuje zaravljenu" distribuciju.)
Standard error = StdDev/Sqrt(12)= 25.89606264678/ 3.46410161
= 7.4755493700355
Raspodele verovatnoe
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
71/166
71
Raspodela kontinuirane
verovatnoe
Binomna
Hipergeometrijska
Poisson-ova
Raspodeleverovatnoe
Raspodela diskretne
verovatnoe
Normalna
Uniformna
Eksponencijalna
Raspodele verovatnoe
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
72/166
DISKRETNE SLUAJNE PROMENLJIVESluajne promenljive (promenljiva koja poprima numerike vrednostiodreene ishodima sluajnog eksperimenta)
Teme:
Oekivana vrednost diskretne sluajne promenljive Varijansa
Binomna distribucija
Poasonova distribucija
Kovarijansa i korelacija
NORMALNA RASPODELA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
73/166
Normalna gustina raspodele verovatnoe:
2)(
21
2
1)(
x
exf
NORMALNA RASPODELA
Normalna raspodela je
potpuno odreena sa: -srednja vrednost
-standardna devijacija
Nain zadavanja:
N(, 2)
OSOBINE NORMALNE RASPODELE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
74/166
OSOBINE NORMALNE RASPODELE
zvonastog oblika simetrina
unimodalna
asimptotska
srednja vrednost, medijana i
mod su jednaki
Raspodelu definiu srednjavrednost, , i standardna devijacija,.
Srednja vrednost definie centar, astandardna devijacija irinu.
OSOBINE NORMALNE RASPODELE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
75/166
OSOBINE NORMALNE RASPODELE
Standardna devijacija je rastojanjeod srednje vrednosti do take gdekriva menja oblik od konkavne nadole u konkavnu na gore
IZGLED NORMALNIH RASPODELA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
76/166
IZGLED NORMALNIH RASPODELA
Promenom parametara i , dobijaju se razliite normalne raspodele
PRIMERI PODATAKA SA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
77/166
PRIMERI PODATAKA SA
NORMALNOM RASPODELOM
oekivani ivotni vek ljudi u populaciji
visina
teina
visina plata broj pacijenata na koji propisani lek deluje
podaci iz proizvodnje
IQ
dr.
GRAFIK NORMALNE RASPODELE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
78/166
GRAFIK NORMALNE RASPODELE
STANDARDIZOVANO ODSTUPANJE(Z SCORE)
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
79/166
(Z-SCORE)
z-scoreje razlika izmeu posmatrane vrednosti i
srednje vrednosti podeljena sa standardnomdevijacijom
To je odstupanje posmatrane vrednosti od srednjevrednosti izraeno u broju standardnih devijacija
Na primer: ako je z = 2, vrednost X je udaljena 2standardne devijacije od srednje vrednosti.Ako je -3,0 > z-score > 3,0
vrednost z-score se smatra ekstremnom
STANDARDIZOVANO
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
80/166
ODSTUPANJE , Z-SCORE
Primer: Prosean unos proteina 77 g/dan, standardna devijacija, Sd =8 g, N = 500
Gde se nalazi osoba koja unosi 93 g/dan ?
28
16
8
7793z
Osoba koja unosi 93 g/dan ima vrednost koja je za 2 Sd vea odprosenog unosa proteina
Negativan z-score znai da je vrednost manja od srednjevrednosti
STANDARDIZOVANA NORMALNA
RASPODELA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
81/166
RASPODELA
standardizovana normalna kriva je simetrinaoko nulenajveideopovrineispod krive leiizmedju -3z i 3zpovrinaispod standardne normalne krive je 1
krajevi krive se asimptotskipribliavajux-osi
standardizovana
normalna kriva
z-score je normalno distribuiran sa srednjom vrednou
0 i standardnom devijacijom 1
standardizovana normalna raspodela
= 0
= 1 0 1
PRIMER
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
82/166
PRIMER
Ako je varijabla x normalno distribuirana sa srednjomvrednou = 5i standardnom devijacijom = 2,
z vrednost za x = 6,2je
Ovo znai da se vrednost x = 6,2 nalazi 0,6 standardnih
devijacija (0,6 inkrementa od 2 jedinice) iznad srednjevrednosti
6,02
52,6xz
PRIMER
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
83/166
6,02
52,6x
z
Normalna raspodela Standardizovananormalna raspodela
6,2 x 0,6
= 2 z= 1
= 5 z= 0
z
PRIMER
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
84/166
25,12
55,7xz25,12
55,2xz
Normalna raspodelaStandardizovana
normalna raspodela
x z
= 2 z= 1
= 5 z= 0
2,5 7,5 -1,25 1,25
NALAENJE VEROVATNOE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
85/166
NALAENJE VEROVATNOE
Verovatnoa jepovrina ispod krive!
c d x
f(x)
?P c X d
VEROVATNOA KAOPOVRINA ISPOD KRIVE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
86/166
POVRINA ISPOD KRIVE
Ukupna povrina ispod krive je1,0
Raspodela je simetrina
f(x)
x
0,50,5
1,0)xP(
0,5)xP( 0,5)xP(
TABELA STANDARDIZOVANE NORMALNE RASPODELE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
87/166
TABELA STANDARDIZOVANE NORMALNE RASPODELE
Tablica standardizovane normalne raspodele dajeverovatnou, odnosno povrinu za vrednosti manje odeljene vrednosti z (od - do z)
primer:
P(z < 2,00) = 0,9772 0.9772
z0 2,00
TABELA STANDARDNE NORMALNE
RASPODELE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
88/166
RASPODELE
Verovatnoa/povrinazavrednosti manje z manje odeljene vrednosti z
0,9772
2.0P(z < 2,00) = 0,9772
U redovima su vrednosti
z do prvog decimalnog
mesta
U kolonama su vrednosti z na
drugom decimalnom mestu
2,0
.
.
.
Z 0,00 0,01 0,02
0,0
0,1
VANE POVRINE ISPOD KRIVE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
89/166
VANE POVRINE ISPOD KRIVE
Povrina izmeu -1z i +1z = 0,6826 = 68,3%Verovatnoa da se varijabla x nae u granicama jednestandardne devijacije ili -1z i +1z je 68,3%
P = 0,6826 = 68,3%
VANE POVRINE ISPOD KRIVE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
90/166
VANE POVRINE ISPOD KRIVE
U rasponu je
68,3%povrine ispod krive, odnosno
68,3% svih vrednosti
f(x)
x +1-1
68,26%
VANE POVRINE ISPOD KRIVE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
91/166
Povrina izmeu -2z i +2z =
0,9544 = 95,4%
Verovatnoa da se varijabla xnae u granicama -2z i +2z :P = 0,9544 = 95,4%
Povrina izmeu -3z i +3z =
0,9974 = 99,7%
Verovatnoa da se varijabla xnae u granicama -3z i +3z :P = 0,9974 = 99,7%
VANE POVRINE ISPOD KRIVE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
92/166
x
2 2
95.44%
+2-2x
3 3
99.73%
-3 +3
U rasponu 2 je
95,4%povrine ispodkrive
95,4% svih vrednosti
U rasponu 3 je
99,7%povrine ispodkrive
99,7% svih vrednosti
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
93/166
DISTRIBUCIJE UZORAKA
Za odnos standardne devijacije osnovnog skupa i standardnedevijacije distribucije uzoraka vai izraz:
Navedena relacija o odnosu standardne devijacije distribucijeuzoraka i standardne devijacije osnovnog skupa vai zabeskonane osnovne skupove i za konane skupove sponavljanjem.
Izraz za standardnu greku procene aritmetike sredine zakonane skupove je:
nx
1
N
nN
nx
TEORIJA MALIH UZORAKA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
94/166
TEORIJA MALIH UZORAKA
esto se koristi injenica da se uzorci veliineN>30,nazivaju velikim, a distribucija velikog broja statistika je
aproksimativno normalna i pribliavanje normalnojdistribuciji je bolje kako N raste.
Za uzorke veliineN
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
95/166
U verovatnoi i statistici, Studentova t-raspodela (ili jednostavno t-distribucija) sa (n-1) stepeni slobode , t(n-1), je neprekidna raspodelaverovatnoa koja nastaje kada se procenjuje srednja vrednostnormalno distribuirane populacije u situacijama gde je uzorak mali istandardna devijacija populacije, , je nepoznata.
Ako = s, t = Z, T distribucija postaje normalna raspodela. Kao Nraste, Studentova distribucija se pribliava normalnoj raspodeli.
Studentova raspodela se moe izvesti transformacijom Studentovez-raspodele koristei i zatim definisanjem
t-raspodelaje simetrina i u obliku zvona, kao normalnadistribucija, ali ima vee repove, to znai da je vie sklona da
proizvodi vrednosti koje padaju daleko od svog proseka. To je inikorisnim za razumevanje statistikog ponaanje pojedinih vrstaodnosa sluajnih veliina, u kojima su varijacije u imeniocu vee imoe se desiti da se pojave ekstremne vrednosti u sluajevima kadaimenilac pada blizu nule.
PRIMENA STUDENTOVE RASPODELESt d t d l i l i i k k i ih t ti tikih
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
96/166
Studentova raspodela igra vanu ulogu u nizu iroko korienih statistikihanaliza:
za procenu statistike znaajnosti razlike izmeu srednjih vrednosti dvauzorka,
za konstrukcija intervala pouzdanosti za testiranje razliku izmeusrednjih vrednosti dve populacije, i u analizama linearne regresije.
PROCENA PARAMETARA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
97/166
PROCENA PARAMETARA
OSNOVNOG SKUPA
Procenjivanje nepoznatih parametara osnovnog skupa zasniva se napodacima koji predstavljaju sluajan uzorak i na izraunavanjuodgovarajue statistike uzorka.
Parametri se mogu proceniti brojem i intervalom.
Izraunata vrednost statistike uzorkaje procena parametra brojem, aprocena intervalom se sastoji u odreivanju granica raspona varijacijeukojem se prema nekom kriteriju oekuje da e biti vrijednost nepoznatog
parametra.
PROCENA PARAMETARA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
98/166
PROCENA PARAMETARA
OSNOVNOG SKUPA
Interval procene aritmetike sredine se odreuje kaointerval vrednosti oko aritmetike sredine uzorka.
irina ovog intervala zavisi od pouzdanosti procene ioblika sampling distribucije aritmetikih sredinauzoraka.
Sampling-distribucija aritmetikih sredina uzorakaodreene veliine ima normalan oblik (Centralnagranina teorema).
12121 xx zxzxP
PROCENA PARAMETARA
OSNOVNOG SKUPA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
99/166
OSNOVNOG SKUPA
Standardna grekaprocene aritmetike sredine je funkcijaveliine uzorka. Za poznatu vrednost standardne devijacijeosnovnog skupa, ona iznosi .
U praksi uglavnom nije poznata standardna devijacija
osnovnog skupa, ve se ona procenjuje pomou standardnedevijacije uzorka.
Izraz za nepristrasnu procenu varijanse je:
nx
1
1
2
2
n
xxS
n
i
i
PROCENA PARAMETARA OSNOVNOG SKUPA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
100/166
PROCENA PARAMETARA OSNOVNOG SKUPA
Procenjena vrednost standardne greke je
Standardizovana vrednost tima oblik tzv. Studentove ili T-
distribucije sa (n-1) stepena slobode.
Za velike uzorke sampling distribucija se moe aproksimiratinormalnom distribucijom
nSSx xS
xt
)1()( 2121 xx SzxSzxP
)1()( )1;2()1;2( xnxn StxStxP
SREDNJE VREDNOSTI
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
101/166
UZORAKA I POPULACIJE
Ako posmatramo sve mogue uzorke veliine n iz populacije od Njedinica i ako za svaki uzorak izraunamo srednju vrednostiposmatramo distribuciju tako dobijenih srednjih vrednosti.
+ + .
=
Moe se pokazati da je aritmetika sredina te distribucije (sredinauzoraa) jednaka aritmetikoj sredini osnovnog skupa
=
CENTRALNA GRANINA TEOREMA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
102/166
CENTRALNA GRANINA TEOREMA
Neka je X1, X2, , Xn sluajan uzorak uzet izproizvoljne distribucije sa srednjom vrednouivarijansom 2
Ako nide u beskonanost, distribucija uzoraka oblika
konvergira ka N(0,1) distribuciji.
KONCEPCIJA TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
103/166
Nulta i alternativna hipoteza
Testiranje sredine normalne distribucije u sluaju poznate varijansepopulacije
Interpretacija vrednosti verovatnoe ili p-vrednosti
Testiranje sredine normalne distribucije u sluaju nepoznate varijanse
Testiranje hipoteza proporcijskog udela u
populaciji (veliki uzorak)
Primeri
NULTA I ALTERNATIVNA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
104/166
Kod svakog problema koji se razmatra, obinose mogu pojednostavlenoformulisati dve suprotstavlenetvrdnje (hipoteze):
Nulta hipoteza, oznaujese sa H0, i
Alternativna hipoteza, oznaenasa H1.
Ove dve konkurentske tvrdnje( hipoteze) se meutimne tretiraju ravnopravno,vese: posebna panja posveujenultoj hipotezi.
Uobiajena je situacija: Eksperiment se sprovodi u pokuajuda se opovrgne ili
odbaci odreenunultu hipotezu tako da se njoj daje prioritet u smislu da se onane moe odbaciti ukoliko dokazi protiv nje nisu dovolnojaki.
Na primer,
H0: nema razlike u ukusu izmeunormalnog i Diet Coca Cole
H1: postoji razlika.
Ako je jedna od dva tvrdnje "jednostavnija" njoj se obinodaje prioritet, tako dase "komplikovanija" teorija ne usvaja ukoliko nema dovolnodokaza protiv
jednostavnije.
Na primer, "jednostavnija" je tvrdnja da nema razlike u ukusu izmeuobineidijet Coca Cole i tvrdnje da postoji razlika.
VRSTE HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
105/166
Moemo rei da postoje 2 vrste hipoteza:
1.Hipoteze koje se odnose na raspodele obeleja nazivaju se neparametarskehipoteze
paramerarske hipotezeodnose na karakteristine parametre populacijekao tosu oekivanavrednost i varijansa.
Primer:
Ako naprimer bacamo kocku 1000 puta i ako se 6 pojavi 185 puta ,parametarska hipoteza bi bila da je
neparametarska hipoteza bi bila da se verovatnoepojave odreenogbroja
rasporeujupo binomnoj raspodeli
1
6p
, ,
1, 1000, 185,
6
1 n kk
n k p
p n k
nP p p
k
PARAMETARSKE I NEPARAMETARSKE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
106/166
HIPOTEZE
Primer parametarske hipoteze:
H0: oekivanavrednost visine deset godina starih deakau srpskojpopulaciji nije drugaija od oekivanevrednosti visine deset godinastarih devojica.
H1: postoji razlika u oekivanoj vrednosti visine deset godina starihdeakai devojica u srpskoj populaciji.
Primer neparametarske hipoteze:
H0: Visina deset godina starih deakaje normalno distribuirana usrpskoj populacijii.
H1:Visina deset godina starih deakanije normalno distribuirana usrpskoj populacijii.
ISHOD TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
107/166
Ho, polazna-nulta i H1, suprotna-alternativna.
Hipoteza moeda bude pogrenai tana.
Zato se postavljene hipoteze podvrgavaju se statistikom proveravanju, testiranju,verifikaciji, pomou koga se donose odluke, da li sa odreenom verovatnoom,hipoteze se prihvataju ili odbacuju.
Savremenu teoriju verifikacije dali su Nejman i Pirson (1928,1933 )
Ishod testiranja hipoteza moe biti:1. "Odbaci H0 u korist H1(kao posledicu eksperimenta na uzorku i prihvatamo
H1) ili
2. Ne odbaci H0 (jer nema dokaza protiv nje).
Primer:
Ako je proizvodja lansirao na trite nov proizvod, on mora da dokae da jenjegov proizvod bolji od postojeih.
Polazna hipoteza Ho je da je novi proizvod najbolj i, i da bi dokazao tu hipotezu, onmora da obori suprotnu, alternativnu H1, da su stari proizvodi bolj i od novog.
POSTUPAK TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
108/166
Postupak testiranja hipoteza o vrednosti nekog parametra
osnovnog skupa sprovodi se prema precizno definisanojproceduri. Koraci u tom postupku su:
1. formulacija statistike hipoteze;2. izbor statistike testa i odreivanje njenog oblika
distribucije;
3. odreivanje nivoa znaajnosti testa;4. definisanje pravila na osnovu kog se odluuje o
prihvaanju ili odbacivanju hipoteze;5. izbor sluajnog uzorka odreene veliine i izraunavanje
statistike testa;
6. donoenje odluke o prihvaanju ili odbacivanjuhipoteze.
POSTUPAK TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
109/166
Nulta i alternativna hipoteza predstavljaju dve precizne,
meusobno iskljuive tvrdnje o vrednosti nekog parametraosnovnog skupa.
dvosmerni test
jednosmerni, test na gornju granicu
jednosmerni, test na donju granicu
00 : H 01 : H
00 : H 01 : H
00 : H 01 : H
POSTUPAK TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
110/166
Statistika testa ili test-statistika je kriterijum na osnovu kog sesprovodi testiranje.
Kod testiranja pretpostavki o vrednosti parametara osnovnogskupa, statistika testa je nepristrasna procena parametra ili neka
transformacija te procene. Statistika testa je sluajna varijabla koja poprima odreeni oblik
distribucije verovatnoe.
Za primer varijable aritmetike sredine uzorka vai pravilo onormalnom obliku distribucije ~ N*,
2
0 , x
* Centralna granina teorema
TESTIRANJE HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
111/166
TESTIRANJE HIPOTEZA
Njena standardizovana vrednost
za velike uzorke ima oblik jedinine normalne distribucije Z ~ N(0,1), aza male uzorke standardizovana varijabla
ima oblik T-distribucije za (n-1) stepeni slobode.
x
XZ
0
x
XT
0
TESTIRANJE HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
112/166
(1 - )
/2/2
Z ~ N(0,1)
-z 0 +z
Podruje odbacivanja Podruje prihvaanja Podruje odbacivanja
Dvosmerni test
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
113/166
TESTIRANJE HIPOTEZA
-z 0
Podru e odbacivan a Podru e rihvaan a
1 -
Z ~ N(0 , 1)
0 z
Podruje prihvaanja Podruje odbacivanja
1 -
Z ~ N(0 , 1)
Jednosmerni test na donju granicu Jednosmerni test na gornju granicu
TESTIRANJE HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
114/166
TESTIRANJE HIPOTEZA
Sledei korak kod testiranja hipoteze je izbor sluajnoguzorka odgovarajue veliine.
Za uzorakse vre potrebni obrauni i izraunavavrednost statistike testa.
Koristei uzorak, izraunava se standardna greka, brojstepeni slobode, test statistika, i P-vrednost povezana satest statistikom.
Donoenje odluke :
Ako je statistika testa iz podruja prihvaanja nultehipoteze, nulta hipoteza se prihvata kao mogua, aalternativna hipoteza se odbacuje.
U protivnom, kada je vrednost statistike testa iz podrujaodbacivanja hipoteze, prihvatie se alternativna hipoteza.
P-VREDNOST
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
115/166
V NOS
Pretpostavimo da sprovedemo eksperiment u kojem su izmerene
srednje vrednosti u dva uzorka koje su razliite. Kako se moe bitisiguran o pretpostavljenoj srednjoj vrednosti populacije?
Postoje dve mogunosti:
Populacija ima razliitu srednju vrednost. Populacije ima isti srednju vrijednost, a dobijena razlika je poslediva
sluajnog uzorkovanja. P vrednost je verovatnoau rasponu od nula do 1
U praksi se dobijena P-vrednost iz uzorka poredi sa stvarnimnivoom znaajnostinaegtesta (0,05, 0,01) i, ako je manja,dobijena razlika je znaajna. (ako je naa p-vrednost "p
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
116/166
SREDINI OSNOVNOG SKUPA
Testiranje hipoteze o pretpostavljenoj vrednosti aritmetike sredineosnovnog skupa sprovodi se na osnovu sluajnog uzorka veliine njedinica.
Statistika testa je aritmetika sredina uzoraka koja predstavlja sluajnuvarijablu.
Varijabla aritmetikih sredina uzoraka, odnosno njenastandardizovana vrednost, moe imati oblik normalne distribucije iliT-distribucije.
U zavisnosti od oblika distribucije, testiranje hipoteza o aritmetikojsredini osnovnog skupa sprovodi se pomou z-testaili t-testa.
Postupak testiranja hipoteze poinjepostavljanjem nulte i alternativne
hipoteze.
TESTIRANJE HIPOTEZA O ARITMETIKOJ
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
117/166
SREDINI OSNOVNOG SKUPA
Postavka hipoteze za dvosmerni test
Postavka hipoteze za jednosmerni test na gornju granicu
Postavka hipoteze za jednosmerni test na donju granicu
00 : H 01 : H
00 : H 01 : H
00 : H 01 : H
TESTIRANJE HIPOTEZA O ARITMETIKOJ
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
118/166
SREDINI OSNOVNOG SKUPA
Test stati sti ka je varijabla aritmetikih sredina uzoraka koja imanormalnu distribuciju~ (,), ili standardizovana varijablasredina uzoraka,
koja imajedinini normalni oblik distribucije,
Z ~ N(0.1).
Pravilo odluivanjao prihvaanju ili odbacivanju nulte hipoteze sepostavlja u zavisnosti od oblika hipoteze i nivoa znaajnosti testa .
TESTIRANJE HIPOTEZA O ARITMETIKOJSREDINI OSNOVNOG SKUPA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
119/166
SREDINI OSNOVNOG SKUPA
Pravila odluivanja kada je podruje prihvaanja nulte hipoteze datou mernim jedinicama obeleja su:
Kod dvostranog testa nulta hipoteza se prihvata, na nivou znaajnosti, ako je aritmetika sredina uzorka iz intervala (c1,c2), gde je
Kod jednostranog testa na gornju granicu nulta hipoteza se prihvaa kadaje aritmetika sredina uzorka iz intervala (-,c2), gde je
Kod jednostranog testa na donju granicu nulta hipoteza se prihvaa kadaje aritmetika sredina uzorka iz intervala (c1, +,), gde je
xSzc 2/101 xSzc 2/102
xSzc 102
xSzc 101
PRAVILA ODLUIVANJA O TESTIRANJU HIPOTEZA OARITMETIKOJ SREDINI OSNOVNOG SKUPA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
120/166
ARITMETIKOJ SREDINI OSNOVNOG SKUPA
Pravila odluivanja o prihvaanju ili odbacivanju nulte hipoteze kadaje podruje prihvaanja dato u standardizovanim jedinicama su:
Kod dvostranog testa nulta hipoteza se prihvaa, na nivouznaajnosti , kada je empirijska z-vrednost po apsolutnojvrednosti manja od tabline zvrednosti za vrednost funkcije
distribucije
Nulta hipoteza kod jednostranih testova na gornju granicu seprihvaa kada je
Nulta hipoteza kod jednostranih testova na donju granicu seprihvaa kada je
2/1 zz
1zz
1zz
POSTUPAK TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
121/166
Sa unapred zadatom verovatnoom( na primer 0,95) se moe odrediti kritini
interval, npr. (-k, +k) i proveriti da li izraunata vrednost pripada tomintervalu.
U sluaju da pripada se zakljuuje da odstupanja imaju sluajankarakter inema razloga za odbacivanjem nulte hipoteze
Za verovatnou od 0,95, prag znaajnosti je0,05 , a to znai da postoji 5%rizikada se napravi greka tj. daposmatrana vrednosti ne pripadaizraunatom intervalu i da nulta hipotezanije tana.(To znaida su ostupanjaod poetnehipoteze znaajna.)
BITNO:
Treba odrediti kritinuvrednost k.
(Kako odrediti k? Gde povuigranicu izmeusluajnihi znaajnihodstupanja??)
TESTIRANJE CENTRALNE TENDENCIJE-
DVOSTRANI TEST
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
122/166
DVOSTRANI TEST
Ukoliko je dobijamo oblast prihvatanja nulte hipoteze, interval ,k k
0H
2
kk
o
kriticna oblast
oblast odbacivanja H
kriticna
oblast
1 2
tan ooblast prihva ja H
0 0 1 0: :H H
P X k
TESTIRANJE CENTRALNE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
123/166
TENDENCIJE- JEDNOSTRANI TEST
Jednostrani i test:
ko
kriticna oblast
oblast odbacivanja H
1
tan ooblast prihva ja H
k
o
kriticna oblast
oblast odbacivanja H
1
tan ooblast prihva ja H
P X k
P X k
GREKE TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
124/166
Greke prvog tipa, grekenastaju kada nultu hipotezuodbacimo, a tana je i prihvatimo alternativnu hipotezu.
Greke drugog tipa, greke nastaje kada nultu hipotezu neobacimo, a pogrena je.
GREKE TESTIRANJA HIPOTEZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
125/166
Odluka
Odbaciti H0 Ne odbaciti H0
Istina
H0
GrekaI vrste, testiranjem
H0 se odbacuje uz
verovatnou
Prava odluka, testiranjem
H0 se prihvata uz
verovatnou (1)
H1
Dobra odluka, testiranjem
H0 se odbacuje uz
verovatnou (1)
(ova verovatnoa se zove''jaina testa'' ili ''motesta'')
GrekaII vrste, ,
testiranjem H0 se prihvata
TESTIRANJE HIPOTEZE H0(=0)ako je poznato
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
126/166
ako jepoznato U sluaju testiranja nulte hipoteze H0protiv alternativne
hipoteze H1, ako sluajna promenljiva ima normalnuraspodelu, a disperzija je poznata, vai
Ako sluajna promenljiva nema normalnu raspodelu,uvodimo statistiku
koja ima normalnu standardnu, N(0,1) raspodelu, gde je
- aritmetika sredina dobijena na osnovu uzorka,0- predpostavnjena vrednost sredine populacije, - standardno odstupanje populacije inje obim uzorka.
0XZ
n
P X z
TESTIRANJE HIPOTEZA: SREDNJE VREDNOSTI
Testovi mogu bitidvosmernikada testiramo hipotezu da jed j d j d k k j lj j d i
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
127/166
srednja vrednost jednaka nekoj pretpostavljenoj vrednosti,H0(= nasuprot hipoteze H1(
Kritina oblastprihvatanja nulte hipoteze je na osnovu zadatogpraga znaajnosti:
Oblast prihvatanja
[-z, z]
a oblast odbacivanja ,
, ,z z
0 0 0k X k
P
n n n
P z Z z
PRAG ZNAAJNOSTI-DVOSTRANI TEST
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
128/166
Za verovatnou , prag znaajnosti, se obino uzimajuvrednosti 0,01 i 0,05, a za izraunavanje se koristetablice normalne raspodele.
0H2
z 0kriticna oblast za H
oblast odbacivanja
kriticna
oblast
1 2
z
PRAG ZNAAJNOSTI-JEDNOSTRANI TEST
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
129/166
JEDNOSTRANI TEST
z 0kriticna oblast za H
1
0
tan
XZ
n
oblast neprihva jaP Z z
z
0kriticna oblast za H
0
tan
XZ
n
oblast neprihva jaP Z z
taoblast neprihva anja
P Z z
PRIMER:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
130/166
Za doziranje nekog leka se zna se da ima
normalnu raspodelu N(,9). Uzet je uzorakod n= 10 pacijenata i na osnovu dobijenih
podataka dobijena je srednja vrednost dozeod 24,3gr.
Sa pragom znaajnosti od 5% testiratihipotezu za matematiko oekivanje doze od24gr nasuprot altetnativnog matematikogoekivanja doze od 26gr.
PRIMER-REENJE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
131/166
0 1
: ,9 , 24,3
3; 10; 0,05
24 ; 26
X N X
n
H H
0H 0,05
1,64z 0kriticna oblast za H
0,95
3,16
N(, 2
):
Oblast prihvatanja:
< 1
z=z0.95=1,64
24,324310 0,316
0,316
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
132/166
Iz populacije sa obelejem X za koje se zna da je odstupanje 300, ne zna se
raspodela, uzet je uzorak oblika 99856 i na osnovu njega je dobijena srednjavrednost 24,3. Sa nivoom znaajnosti od 5% testirati hipotezu
H0(=24
prema alternativnim hipotezama
1. H1(>24
2. H1(
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
133/166
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0H 0,05
1,64z 0kriticna oblast za H
0,95
24,3X
0 24H 1 24H
0
Oblast prihvatanja:
< 1 z=z0.95=1,64
Kritina vrednost k:2430099856
z0.95 1,6425 ,26
Zakljuak: Ne odbacujemo H0
0 24H 1 24H Reenje za 1- preko kritine vrednosti, Z:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
134/166
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,95
24,3 241,56300
99856
1,64
1,56 1,64
X
n
z z
0H 0,05
1,64z 0kriticna oblast za H
0,95
1,56Z
0 1
Zakljuak: Ne odbacujemo H0
0 24H 1 24H Reenje za 2:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
135/166
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,05
24,3 24 1,56300
99856
1,64
1,64 1,56
X
n
z z
0
0H0,05
1,64z
0kriticna oblast za H
0,95
1,56Z
Zakljuak: Ne odbacujemo H0
0 24H 1 24H
Reenje za 3:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
136/166
hipotezu Ho ne odbacujemo.
0 1
: ,300 , 24,3
9; 99856; 0,05
24 ; 24
X N X
n
H H
0
0,95
ta
0,95
1,96
24,5 240,52 1,96;1,96
300
99856
XZ
n
oblast prihva anja
P Z z
z z
0 1
0H2
z 0kriticna oblast za H
oblast odbacivanja
kriticna
oblast
1 2
z
TESTIRANJE HIPOTEZE H0(= 0)AKO SLUAJNA PROMENLJIVAIMA NORMALNU RASPODELU, A DISPERZIJA JE NEPOZNATA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
137/166
Postupak je sliansluajukod normalne raspodele, samo se sada korististatistika
gde je S standardno odstupanje uzorka, a sluajna promenljiva X imastudentovu t(n-1) raspodelu.
Dvostrana kritina oblast za nultu hipotezu bila bi , a dobija sena osnovu veze
gde se t izraunava iz tablica za studentovu raspodelu.
0X
Ts
n
T t
P T t
PRIMER:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
138/166
Maina proizvodi kuglice prenika debljine 0,5cm.Da bi proverili da likuglice imaju prenik propisane debljine uzima se uzorak od 10 kuglica.Ako je aritmetika sredina uzorka 0,53cm i uzorako standardnoodstupanje 0,03cm, testirati hipotezu da maina proizvodi kuglicepropisanog prenika sa pragom znaajnosti 0,05.
Reenje:
H0: =0,5
H1: 0,5
0,95
0 1 1
: 1 9 2,26
0,03, 10, 0,53
0,5 ; 0,53 0,5
X t n t
s n X
H H H
0/
< /2 ili0/
> /2
REENJEpreko
odredjivanja kritine oblasti:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
139/166
odredjivanja kritine oblasti:
Zakljuak:
Kako je 0,53 >0,52 odbacujemo nultu hipotezu.
k=0,52,
prihvatljiv interval je
(-0,52
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
140/166
odredjivanja t- vrednosti:
Oblast prihvatanja hipoteze Ho
Nultu hipotezu odbacujemo.
0
0,95
0,51 1
0,03
10
0,50, 95, 9 2, 26
0,03
10
2, 26; 2, 26
0, 53 0, 5 3,16 2, 26; 2, 260,03
10
X kP k T k P
s
n
kP T t
REENJEpreko
odredjivanja t vrednosti:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
141/166
odredjivanja t -vrednosti:
hipotezu odbacujemo.
0
0,95
0
0,51
0,03
109 1, 833
1,833
3,16
X kP T k P
s
n
t
t
X
s
n
0 10,5 ; 0,5H H
PRIMER
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
142/166
PRIMER
Prosean broj greaka u radu jedne maine je 8. Posle intervencije na maini mogueje da doe do poveanja broja greaka.
Zadatak: Utvrditi da li je dolo do poveanja broja greaka.
REENJE:
Da bi se to utvrdilo izvreno je 100 merenja i dobijeni su sledei rezultati:
Broj
greaka0-10 10-20 20-30 30-40 >40
Brojmerenja
60 20 10 5 5
REENJE:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
143/166
Na osnovu zadate tablice izrauna se
Hipoteza Ho se odbacuje
2
1
0.99
12,5 128,7 11,35
100; 0,01;
8 899 2,36
12,5 83,94 2,36
11,35
100
o
X s s
t raspodela
n
H Ht
T
Izraunavanje t-vrednosti za 99stepeni slobode za =9,01 za
jednostranu gornju granicu:
t-vrednost (desni deo)= 2,36
PRIMER:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
144/166
U uzorku od 3000 bacanja noviadobijeno je 1578 grbova. Verovatnoadobijanjagrba je 0,5 i taj podatak uzimamo kao nultu hipotezu, a podatak da ese dobiti viegrbova uzima se kao alternativna hipoteza. Testirati nultu hipotezu sa pragom
znaajnostiod 0,01.
Sluajnapromenljiva X predstavlja broj dobijenih grbova, sa binomnom raspodelom,koja se aproksimira normalnom raspodelm.
Iz uslova zadatka dobijamo da je
0 10,5 , 0,5H p H p
0,5; 3000; 1500; 750; 0,01p n np npq
REENJE:
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
145/166
Potrebno je odrediti kritinu vrednostk za nultu hipotezu, i ona u ovomprimeru treba da bude vea od 1500, to odgovara verovatnoi od 0,5grbova. Tada ako je broj izraunatih grbova vei od k,odbacujemo hipotezu,inae je prihvatamo.
Ako bi koristili jednostrani test u naem primeru kritina oblast bila bi
Kako je dobijena vrednost 1578>1564, izraunatavrednost pripada kritinojoblasti i odbacujemo nultu hipotezu .
1 0,01 0,99
1500 15000,99 0,99
750 750
15002,32 1564
750
P X k P X k P X k
X X k kP
npq
kk
0
H
1500
I
1564k 1578
99% 1%
REENJE (II NAIN):
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
146/166
REENJE (II NAIN):
Ovaj primer mogao se reitii na drugi nain, samo izraunavanjempragaznaajnosti. Takva izraunavanjaimaju odreeneprednosti jer sekvantitativno moeodrediti koliko nulta hipoteza protivreihipotezi .
Sada u izraunavanjuemokoristiti dvostrani test i za razliku odpredhodnog izraunavanjaodrediti oblast prihvatanja nulte hipoteze.
T=(1564-1500)/sqrt(750)=2,84, t-vrednost za dvostrani test sa pragom
znaajnosti 0,01= 2,62.
2,84>2,62 to znai da odbacujemo nultu hipotezu.
0H
1500
I
1564k 1578
99% 1%
REGRESIONAANALIZA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
147/166
REGRESIONA ANALIZA
Regresiona analiza se koristi da proceni vezu
UVOD
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
148/166
148
Regresiona analiza se koristi da proceni vezu
izmeu nezavisne i zavisnevarijable (promenljive).
Nakon analize, regresiona statistika moe da sekoristi da predvidi zavisnu variablu kada je
nezavisna variabla poznata.
Regresija prevazilazi korelacionu analizu
dodavanjem predikcije.
Ljudi koriste regresiju na intuitivnom nivou svaki dan:
REGRESIJA NA INTUITIVNOM NIVOU
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
149/166
149
j g j
U poslu,dobro obuen ovek se smatra finansijskiuspenijim.
Majka zna da vie eera u hrani njenog deteta rezultiraveim nivoom energije.
Lakoa buenja ujutru zavisi od toga koliko kasno smosino legli da spavamo.
Kvantitativna regresija dodaje preciznost razvojem
matematikeformule koja moe biti koritena za
predvianje.
Istraiva u medicini moe koristiti teinu
PRIMER
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
150/166
150
Istraiva u medicini moe koristiti teinu(nezavisna promenljiva) da predvidi najbolju dozu
za nov lek (zavisna promenljiva).
Korisnost regresione analize je odreivanje formulekoja najbolje odraava vezu izmeu dve
promenljive.
Onda se moe koristiti tako dobijenaformula da sepredvide vrednosti zavisne promenljive kada je
jedino nezavisna promenljiva poznata.
Doktor moeprepisati odgovarajuudozu baziranuna teini pacijenta.
Regresiona linija (poznata kao linija najmanjih kvadrata) je
REGRESIONA LINIJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
151/166
151
g j (p j j j ) j
crte oekivane vrednosti zavisne variable za sve vrednosti
nezavisne variable.
Tehniki, to je linija koja "minimizira kvadratna odstupanja".Regresiona linija je ona koja najbolje uklapa (fituje) podatke
na scaterplotu.
LINEARNA REGRESIJA- MODEL
VEZE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
152/166
152
Linearna regresija pokuava da modelira vezu izmeu dvevariableprovlaenjemlinearne jednaine kroz posmatranepodatke. Jednavariabla se smatra nezavisnom, a druga zavisnom.
Na primer, modelar moe eleti da uspostavi vezu teina i visina uenika
koristei linearni regresioni model. Pre pokuaja da provuelinearnufunkciju (model) kroz posmatrane podatke prvo mora utvrditi da li
uopte postoji uzajamna povezanost posmatranih variabli.
VEZE
VEZA IZMEU DVE VARIABLE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
153/166
153
Scatterplot moe biti od koristi u odreivanju jaine veze izmeu dvevariable.
Ako se pokae da nema povezanosti izmeu nezavisne i zavisnepromenljive (t.j., scatterplot ne pokazuje ni rastui ni opadajui trend),onda primena linearnog regresionog modela nee biti mogua.
VEZA IZMEU DVE VARIABLE-PRIMER
Scatterplot
http://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htm -
7/23/2019 Uvod Statisticke Metode Istrazivanja
154/166
Visina Teina
175 70
190 87
189 95
179 80
172 69
186 84
168 65
177 75
180 80
Koristei regresionu jednainu, zavisna variabla moebiti predviena prekoi i bl
LINEARNA REGRESIJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
155/166
155
nezavisne variable.
Nagib regresione linije (b) je definisan kao porast zavisne promenjivepodeljen sa porastom nezavisne promenljive x.
(a)je taka gde regresiona linija see y osu.
Nagib u odnosu na x osu i presek sa y osom su inkorporirani u regresionu
jednainu.
Presek sa y osom se obino naziva konstanta, a nagib koeficijent. Potoregresioni model obino nijeperfektan prediktor, moramo odrediti i izraz zagreku jednaine.
Regresiona analiza neke populacije je korisna za teorijska razmatranja, ali u praksipostoji model za procenu koji se dobija iz raspoloivih podataka. Pretpostavimo da
REGRESIONA JEDNAINA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
156/166
156
p j p j j p p pimamo n parova pomatranja (x1, y1) (x2, y2), ... (xn, yn). elimo odrediti pravuliniju
+koja e se najbolje uklopiti u date vrednosti.Da bismo to uradili moramo odrediti koeficijente a i b tako da suma kvadrata razlikastvarnih i procenjenih vrednosti bude minomalna:
( )
U regresionojjednaini, y je uvek zavisna variabla i x je uvek nezavisna variable. Data sutri ekvivalentna naina da se matematikiopielinearni regresioni model.
y = intercept + (slope * x) + error
y = constant + (coefficient *x) + error
y = a + bx + e
Regresionajednaina je y = a + bx +
REGRESIONA JEDNAINA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
157/166
157
g j j y
Postoji nekoliko naina da se izrauna nagib b:
()() () (,)
ili praktino
Intercept where
x i y su variable.b = nagib regresione linijea = presek regresione linije i y ose.
N,N = broj elemenata
= ()()
(
()
)
xbya
xNx
yxNxyb
xbay
22
ODSTUPANJA
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
158/166
158
SST-totalna suma kvadrata odstupanja y od srednje vrednosti y
SSR
-Suma kvadrata odstupanja srednje vrednosti za y i regresionevrednosti za y
SSESuma kvadrata greke
SST=SSR + SSE
KOEFICIJENT UKLAPANJA REGRESIONELINIJE
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
159/166
159
Procentualna varijacija y je rezultat varijacije x.
Koeficijenat uklapanja je
Objanjive razlike
Totalne razlike
0
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
160/166
160
PRIMER 1
Odrediti linearnu regresiju
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
161/166
161
Odrediti linearnu regresiju
X Y60 3.1
61 3.6
62 3.8
63 4
65 4.1
Da bismo odredili regresionu jednainu, moramo nai nagib, intercept i uvrstiti ih u regresionu
jednainu..
Korak 1: Izraunati broj podataka.
REENJE=
(
)(
)
( ())
Korak 3:NaiX, Y, XY, X .
X = 311
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
162/166
162
N = 5
Korak 2: NaiXY, X2Pogledaj tabelu
b=0,19
a=-8,098
Y=-8,098+0,19X
X Value Y Value X*X X*Y
60 3,1 3600 186
61 3,6 3721 219,662 3,8 3844 235,6
63 4 3969 252
65 4,1 4225 266,5
311 18,6 19359 1159,7
Intercept(a) = (Y -b(X)) / N
X = 311
Y = 18.6
XY = 1159.7X
2= 19359
Korak 4: Zameniti vrednosti u datu formulu za nagib.
Nagib(b) = (NXY - (X)(Y)) / (NX2- (X)2)
= ((5)*(1159.7)-(311)*(18.6))/((5)*(19359)-(311)2)
= (5798.5 - 5784.6)/(96795 - 96721)
= 13.9/74
= 0.19
Korak5: Sada zameniti vrednosti u formulu zaintercept a.
Intercept(a) = (Y -b(X)) / N= (18.6 - 0.19(311))/5
= (18.6 - 59.09)/5
= -40.49/5= -8.098
Korak 6: Na kraju zameniti dobijene vrednosti u formulu regresione linije:
Regression Equation (y) = a + bx = -8.098 + 0.19x.
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
163/166
163
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
164/166
164
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
165/166
165
-
7/23/2019 Uvod Statisticke Metode Istrazivanja
166/166
HVALA NA PANJI!