Interval spolehlivosti pro pod íl - FD hlavní stránka...Testová statistika H0 zamítáme na...

1

Interval spolehlivosti pro podInterval spolehlivosti pro podííll

http://www.causeweb.org/repository/statjava/ConfIntApplet.html

NNááhodný výbhodný výběěrr

Zkoumaný proces chápeme jako náhodnou veličinu s určitým, nám neznámým rozdělením a měřená data jako realizace této náhodnéveličiny. Výběr dotazovaných jednotek musí být nezávislý.Jestliže výběr opakujeme, dostaneme jiné odpovědi. Abstraktně lze definovat náhodný výběr jako uspořádanou n-tici (vektor) náhodných veličin.

De f i n i c eNáhodný výběr X = [X1, X2, . . . ,Xn] je vektor nezávislých a stejněrozdělených náhodných veličin.– n – rozsah výběru– Konkrétní hodnoty – realizace náhodného výběru

2

Parametry základního souboru (populace),

resp. parametry rozděleníX Výběrové charakteristiky

relativní četnost

p

výběrová

směr. odchylka

s

výběrový

rozptyl

s2

průměrVýběrový

soubor

(výběr)

pravděpodobnost

rel. četnost

π

směrodatná

odchylka

σ

rozptyl

σ2

střední

hodnota

µ

Základní

soubor

(populace)

Bodový odhad parametruBodový odhad parametru

"100.000 syslůse nemůže mý

lit."

(Zákon velkých čísel)

n

np i=

BernoullihoBernoulliho zzáákon velkých kon velkých ččííselsel

Relativní četnost sledovaného jevu v posloupnosti nezávislých pokusů konverguje podle pravděpodobnosti k pravděpodobnosti sledovaného jevu, roste-li počet pokusů nade všechny meze

0lim =

>−

∞→εp

n

SP n

n

ChinChinččininůůvv zzáákon velkých kon velkých ččííselsel

Aritmetický průměr nezávislých výběrů ze stejného rozděleníkonverguje podle pravděpodobnosti ke střední hodnotě.

01

lim1

=

>−∑

=∞→

εµn

i

in

Xn

P

3

Vlastnosti dobrVlastnosti dobréého odhaduho odhadu

Nestrannost (nevychýlenost, nezkreslenost)střední hodnota statistiky je rovna odhadovanému parametruAsymptoticky nestranný odhad – Při rostoucím rozsahu výběru se vychýlení zmenšujeKonzistence – konverguje podle pravděpodobnosti k odhadovanému parametru. S rostoucím rozsahem výběru klesá pravděpodobnost, že se použitá statistika bude od odhadovaného parametru významně lišit.Vydatnost (eficience).O statistice, která má ze všech nestranných odhadů nejmenšírozptyl říkáme, že je vydatným (nejlepším) nestranným odhademMaximálně věrohodný odhad parametru t je maximem věrohodnostní funkce f(x,t), kde f(x) je hustota proměnné x.

UrUrččeneníí ppřřesnosti odhaduesnosti odhadu

Přesnost měření (pozor na počet platných číslic)Průměr + SD. – (směrodatná odchylka)Průměr a meze tolerančního intervaluPrůměr + SEM (standard error of mean ) – info o vydatnostiodhadu průměru

Průměr a meze intervalu spolehlivosti

216 ±

nsSEM /=

4

IntervalovIntervalový odhad parametruý odhad parametru

Intervalový odhad – získáme z bodového odhadu a zadáním pravděpodobnosti (koeficientu spolehlivosti) s jakou parametr leží v tomto intervalu.

Většinou počítáme 95%, nebo 99 % intervaly spolehlivosti(CI -confidence interval). – Čím větší je koeficient spolehlivosti, tím větší je i délka intervalu

CentrCentráálnlníí limitnlimitníí vvěětata

Údaje, které jsou ovlivňovány velkým počtem malých a na sobě nezávislých efektů budou rozděleny přibližně normálněČím větší je rozsah výběru, tím více se rozdělení průměrů blíží normálnímu rozdělení

5

Lévyho-Lindebergova věta.

Pokud je náhodná veličina X součtem n vzájemně nezávislých náhodných veličin X1,

X2,…Xn se shodným rozdělením libovolného typu, s konečnou střední hodnotou µ a s

konečným rozptylem σ2, pak pro normovanou náhodnou veličinu

platí vztah

kde Φ(u) je distribuční funkce normovaného normálního rozdělení N(0,1).


Př: Doba životnosti auta má exponenciální rozdělení s parametrem (1/15). Potom normovaný tvar průměru dob životnosti nezávisle vyráběných aut

je možné aproximovat normálním rozdělením N(0,1)

2σ

µ

n

nXU

−=

( ) )(lim uuUPn

Φ=<∞→

n

XU

15

15−=


http://www.causeweb.org/repository/statjava/CLTApplet.html

6

Konstrukce intervalových odhadKonstrukce intervalových odhadůů

100(1-α)% hladina spolehlivosti, α - hladina významnosti (volíme 0,05; 0,01)Jednostranné– Levostranné

– Pravostranné

Zvolíme vhodnou výběrovou charakteristiku, jejíž rozdělení známe– T(X)

( ) ( ) ααα −=>∞ −− 1)(;; 11 xXTPx

( ) ( ) ααα −=

7

Intervalových odhad pro stIntervalových odhad pro střřednedníí hodnotuhodnotu

Dvoustranné

Zvolíme vhodnou výběrovou charakteristiku, jejíž rozdělení

známe (testová statistika) – Z(X)

( ) ( )2

)(2

12

ααα =

≥=<

−zXZPzXTP

ασ

µσ

ασ

µ

α

αα

αα

αα

−=

+

9

Intervalový odhad stIntervalový odhad střřednedníí hodnotyhodnoty

Příklad– V průběhu jednoho roku byl náhodně zjišťován počet cestujících

ve vlacích na trase Praha – Olomouc. Ze 30 hodnot byl vypočtený průměr 450 a směrodatná odchylka s = 30. Určete 99% interval spolehlivosti.

Můžeme tedy s pravděpodobností 95% říci, že střední hodnota počtu cestujících je mezi 434 a 465.

( ) )465;434(095,15450;095,15450

095,15756,230

30

30

30

; je stispolehlivo interval

29;005,01,

21

1,2

11,2

1

=+−

=⋅=⋅=⋅

⋅+⋅−

−−

−−−−

ttn

s

tn

sXt

n

sX

n

nn

α

αα

Rozsah výbRozsah výběěru pro odhad stru pro odhad střřednedníí hodnotyhodnoty

Známe směrodatnou odchylku

Rozsah výběru pro 100(1-α)% IS pro µ se zadanou chybou ∆µ:

⋅+⋅−

,2

,2

; IS αασσ

zn

Xzn

X

2

2

2

∆=⇒⋅=∆

µ

σσ

µα

α

z

nzn

Př: Určete rozsah výběru nutný k tomu, aby byla odhadnuta s 95 % spolehlivostí hledaná střední hodnota IQ studentů ČVUT s přípustnou chybou 5 bodů inteligenční stupnice.

6,345

1596,12

=

⋅=n

10

JednovýbJednovýběěrovýrový zz--test o sttest o střřednedníí hodnothodnotěě

H0: µ=µ0 při známém rozptylu (dvoustranný test)

Testová statistika

H0 zamítáme na hladině významnosti α, jestliže hodnota parametru daná nulovou hypotézou nepadne do (1-α)100% intervalu spolehlivosti pro testovaný parametr.

)1,0()( 0 NnX

XZ ≈−

=σ

µ

Obor přijetí:

P-hodnota:

−2

12

, αα zz

= 2*MIN( ZTEST(array,x,[sigma]), 1-ZTEST(array,x,[sigma]) )

))(),(min(2 cc zZPzZP ≥≤

P-hodnota

JednovýbJednovýběěrovýrový zz--test o sttest o střřednedníí hodnothodnotěě

H0: µ < µ0 při známém rozptylu (levostranný test)Obor přijetí :

H0: µ > µ0 při známém rozptylu (pravostranný test)Obor přijetí :

( )∞,αz

( )α−∞− 1, z

= ( ZTEST(array,x,[sigma])

P-hodnota pro H0: µ < µ0 :

( )0zZP ≤

( )0zZP ≥

11

JednovýbJednovýběěrovýrový ZZ--testtest

Intervalový odhad rozptyluIntervalový odhad rozptylu

Předpoklady– Normální rozdělení

⋅−

⋅−

−=

⋅−

12

Intervalový odhad podIntervalový odhad podíílulu

Předpoklady– Počet výskytu hledaného znaku je alespoň 5

kde je kvantil normovaného normálního rozdělení.

Rozsah výběru pro přípustnou chybu odhadu ∆p.

( ) ( )

⋅

−⋅+⋅

−⋅−

−−2

12

1

1;

1αα z

n

pppz

n

ppp

2

αz

( )2

2/1

∆−=

p

zppn α

95% interval spolehlivosti v Excelu 2003

NORMSINV(0,975) kvantil normálního rozdělení

DU: Rozsah výbDU: Rozsah výběěru pro podru pro podííll

Kolikrát musíme opakovat hod mincí, abychom s 95% pravděpodobností dostali výsledek relativní četnosti v intervalu (0,4; 0,6).

Během pátečního odpoledne byla naměřena doba čekání na metro ve stanici Dejvická (txt – údaje v sekundách). Testujte, zda je průměrná doba čekání větší než 2 minuty.

( )2

2/1

∆−=

p

zppn α

[96 pokus

ů]

[H0: µ

Interval spolehlivosti pro pod íl - FD hlavní stránka...Testová statistika H0 zamítáme na...

Documents

Transcript of Interval spolehlivosti pro pod íl - FD hlavní stránka...Testová statistika H0 zamítáme na...