TEORETICKÉ MODELY některých DISKRÉTNÍCH NV

21
Teoretické modely diskrétních náhodných veličin Veličiny, kterými se zabýváme, bývají nejrůznější povahy. Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti. Typové modely takových rozdělení byly stanoveny teoreticky a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně. Mějme naměřená reálná (empirická) data - obvykle výběrový soubor z nějaké populace. Snažíme se nalézt teoretické rozdělení a stanovit jeho parametry tak, aby co nejlépe odpovídalo našemu reálnému rozdělení četností. Jinými slovy: Vybíráme takový „model rozdělení“, který vystihuje povahu našich reálných (empirických) dat.

description

TEORETICKÉ MODELY některých DISKRÉTNÍCH NV. Veličiny, kterými se biolog, lékař, zemědělec, historik, … zabývá, bývají nejrůznější povahy. - PowerPoint PPT Presentation

Transcript of TEORETICKÉ MODELY některých DISKRÉTNÍCH NV

Teoretické modely diskrétních náhodných veličin

Veličiny, kterými se zabýváme, bývají nejrůznější povahy.Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti.

Typové modely takových rozdělení byly stanoveny teoreticky a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně.

Mějme naměřená reálná (empirická) data - obvykle výběrový soubor z nějaké populace. Snažíme se nalézt teoretické rozdělení a stanovit jeho parametry tak, aby co nejlépe odpovídalo našemu reálnému rozdělení četností.Jinými slovy: Vybíráme takový „model rozdělení“, který vystihuje povahu našich reálných (empirických) dat.

Rovnoměrné diskrétní rozdělení

Náhodná veličina má rovnoměrné diskrétní rozdělení, jestliže k - hodnot, kterých může nabývat, se vyskytujes pravděpodobností

Rozdělení je modelem pokusů házení mincí (k=2) nebo házení hrací kostkou (k=6)

Střední hodnota je

a rozptyl je var(X)=E[X-E(X)]2 = E(X2) - [E(X)]2

kik

xXP i ...,,2,1,1

)(

k

iii

k

ii x

kxXPxXE

11

1)()(

2

112

2 11)var(

k

ii

k

ii x

kx

kX

Příklad: Rovnoměrné diskrétní rozdělení

Hod mincí 1. stranu označíme 1 2. stranu označíme 2

Hod kostkou

5,12

3

2

1)(

2

1

i

ixXE

5,36

21

6

1)(

6

1

i

ixXE

25,04

9

2

5

2

1

2

1)var(

22

1

2

12

2

ii

ii xxX

92,236

441691

36

21

6

91

6

1

6

1)var(

226

1

6

12

2

ii

ii xxX

Binomické rozdělení Bi (n; π)

Toto rozdělení má náhodná veličina X, která vznikne jako součet n nezávislých alternativně* rozdělených náhodných veličin se stejným parametrem π (pravděpodobnost úspěchu).

Diskrétní náhodná veličina X má binomické rozdělenís parametry n, π, π Є (0, 1), resp.nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností

Střední hodnota:

Rozptyl:

*Alternativně - mají jen 2 možné výsledky: úspěch x neúspěch

xnx

x

nxXP

1)(

nXE )(

)1()(var nX

),(),( nBnBi

Příklad: Hokejisté mají proměnit 5 trestných střílení. Jsou vybráni hráči, u nichž pravděpodobnost vstřelení branky je 0,8. Jaká je pravděpodobnost, že vstřelí branku ze všech pěti pokusů?

Podle pravidla násobení pravděpodobností: p = 0,8*0,8*0,8*0,8*0,8

Jaká by byla pravděpodobnost, že vstřelí branku jen ve třech stříleních? Z definice binomického rozdělení: p = počet možností * (0,8)3 * (0,2)2

Binomické rozdělení je rozdělením nezávislých pokusů alternativní veličiny se stejnou pravděpodobností úspěchu.

Binomické rozdělení Bi (n; π)

xnx

x

nxXP

1)( 353 8,018,0

3

5)3(

XP

Binomické rozdělení Bi (n; π)

Máme alternativní veličinu např. indikující, že daná osoba

trpí diabetem s pravděpodobností p = π a osoba je zdravá s pravděpodobností p = 1 - π

Předpoklady: všechny osoby mají stejnou pravděpodobnost výskytu onemocnění

výskyt diabetes je u jednotlivých osob nezávislý(nejedná se o nakažlivou chorobu)

Sledovaná populace: n osob Ve výběru bude: x nemocných

Pravděpodobnost, že X = x

xnx

x

nxXP

1)(

Binomické rozdělení - grafické znázornění

0 10 20 30

π=0,5 π=0,01 π=0,2 π=0,95

xnx

x

nxXP

)1()(

X … náhodná veličinax … hodnota NV, které dosáhne (např. pro 30 měření 0, 1, 2, …, 30)π … pravděpodobnost, s jakou je jev pozorován1-π … pravděpodobnost, s jakou jev nenastane

Alternativní (Bernoulliho) rozdělení

je zvláštním případem Binomického rozdělení a nazývá se Alternativní neboli Bernoulliho rozdělení.

Alternativní veličina – indikátor nemoci, symptomu, … .

NV může nabývat pouze hodnoty 1 s pravděpodobností pnebo hodnoty 0 s pravděpodobností (1-p)

Střední hodnota E(X) = pRozptyl var(X) = p(1-p)

PŘ1: počet lvů při hodu 1 mincí - buď padne 1 lev nebo žádný, p = 0,5

PŘ2: riziko onemocnění, pravděpodobnost výhry, ...

Kde a … počet pozitivních odpovědí (nemocných, losů, které vyhrávají). b … počet negativních odpovědí (počet zdravých, losů bez výhry)

ba

ap

),1( Bi

U předchozího binomického rozdělení jsme sledovali soubor konečného, často malého rozsahu. Ale často se stává, že sledovaná populace může být velmi rozsáhlá nebo dokonce „nekonečná“, např. sledujeme počet onemocnění klíšťovou encefalitidou v populaci ČR v každém týdnu aktuálního roku.

Parametr n v tomto případě neznáme a rozdělení veličiny můžeme popsat vzorcem , kde

λ je jediným parametrem tohoto rozdělení a vyjadřuje pravděpodobnost, že ve výběru bude x nemocných.Rozdělení se nazývá Poissonovo rozdělení.

Poissonovo rozdělení

ex

xXPx

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Diskrétní náhodná veličina X má Poissonovo rozdělenís parametrem λ > 0, nabývá-li hodnot x = 0, 1, 2, …

s pravděpodobností

Základní charakteristikystřední hodnota a rozptyl:

Distribuční funkce (kumulativní pravděpodobnosti):

Poissonovo rozdělení je rozdělením řídkých jevů.

ex

xXPx

!)(

)(var)( XXE

Poissonovo rozdělení )(Po

xt

t

texF

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Spolu s Binomickým rozdělením se používá nejčastěji pro popis veličin, které vyjadřují počet nalezených objektů našeho zájmu:

- počet hovorů za jednotku času v telefonní ústředně- počet vadných výrobků- počet kazů na látce- počet částic v jednotce objemu

Pro velká n a malá p lze Binomické rozdělení aproximovat Poissonovým rozdělením Po (λ = np)

Vztah platí i opačně – Poissonovo rozdělení můžeme aproximovat Binomickým: - zvolíme dostatečně velké n (řádově 100 – 1000 x větší než λ) a p vypočteme jako p = λ/n

Poissonovo rozdělení )(Po

Př. Sledujeme počet infekcí horních dýchacích cest dětí během prvních tří let jejich věku ve velmi rozsáhlé populaci a z těchto sledování stanovíme pravděpodobnost tohoto onemocnění a označíme ji λ.

Pravděpodobnost, že ve výběru bude x nemocných, vypočteme pomocí Poissonova rozdělení

za předpokladů: všechny děti mají stejnou pravděpodobnost onemocnění výskyt onemocnění je u jednotlivých osob nezávislý

Poissonovo rozdělení

ex

xXPx

!)(

Německý statistik Borkiewicz sledoval po dobu 10 let ve 20-ti německých armádních sborech zabití vojenských osob úderem koňského kopyta

Očekávaná hodnota λ (lambda) byla podle propočtů počet mrtvých / počet sledování 122 / 200 = 0,61

Skutečnost Propočet0 mrtvých 109 109

1 mrtvý 65 662 mrtví 22 203 mrtví 3 44 mrtví 1 0,6

ex

xXPx

!)(Poissonovo rozdělení

Poissonovo rozložení - smrt po úderu koňským kopytem

Počet úmrtí Vypočtený počet

vojenských sborů

Porovnání se skutečným sledováním

0 0,543 108,7 109

1 0,331 66,3 65

2 0,101 20,2 22

3 0,0205 4,1 3

4 0,0031 0,6 1

5 0,00038 0,1 0

6 0,000038 0,0 0

ex

xXPx

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

MODŘE - skutečnostŠEDĚ – propočet

Poissonovo rozložení - smrt po úderu koňským kopytem

ex

xXPx

!)(

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

1 3 5 7 9 11 13 15 17 19 21 23

λ=0,5

λ=1

λ=2

λ=4

λ=10

Frekvenční funkce Poissonova rozložení v závislosti na λ

ex

xXPx

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Příklad: Do podnikové telefonní ústředny přichází v průměru 120 hovorů za hodinu. Vypočtěte, jaká je pravděpodobnost:

a) že za půl minuty nepřijde hovorb) že přijdou méně než tři hovory

Řešení: 120 hovorů za hodinu znamená 1 hovor za půl minuty: λ = 1 Jedná se o řídký náhodný jev, proto ho můžeme modelovat Poissonovým rozdělením.Pro hledaný časový interval půl minuty, tj, λ=1 se vzorec zjednoduší na

Pro X=0 je

Pro X=1 je

Pro X=2 je

a) P(X=0) = 0,368 b) P(X<3) = 0,368+0,368+0,184 = 0,92

ex

xXPx

!)(Poissonovo rozdělení - příklad

exe

xxXP

x

!

1

!

1)( 1

368,01

!0

1)0(

eeXP

368,01

!1

1)1(

eeXP

184,02

1

!2

1)1(

eeXP

Multinomické rozdělení

Příklad:

sledujeme nominální veličinu rodinný stav matkysvobodná, vdaná, rozvedená, vdova

Pravděpodobnost, že z n – matek bude právěk1 svobodných, k2 vdaných, k3 rozvedených a k4 vdov vyjadřuje vzorec:

P(X1=k1, X2=k2, X3=k3, X4=k4) =

43214321

4321 !!!!

! kkkk ppppkkkk

n

Hypergeometrické rozdělení H(M,N,n)

Mějme: N předmětů, z tohoM předmětů jednoho druhuN - M předmětů druhého druhu

Vylosujeme n předmětů bez vracení, kde je x - předmětů prvního druhu, např. x = 0 znamená, že 1. druh nebyl tažen.Sledujeme počet úspěchů x v n - závislých pokusech

Ne všechny situace jsou možné, musíme stanovit podmínky.

Příklad 1: Z osudí, ve kterém je N kuliček, z toho M bílých, vybíráme náhodně n jednotek a ptáme se, kolik je mezi nimi bílých kuliček. (Losovat můžeme postupně, ale důležité je, že kuličky zpět nevracíme).

Příklad 2: Losování sportkyPředměty prvního druhu jsou označeny veřejným losováním ve hře sportka. Výběrem čísel na tiketu jsme losovali právě tyto předměty prvního druhu.

Hypergeometrické rozdělení H(M,N,n)

Diskrétní náhodná veličina X má hypergeometrické rozdělenís parametry M, N, n, kde M, N, n jsou přirozená čísla a n Є (0, M), nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností

Základní charakteristiky:

Střední hodnota:

Rozptyl:

n

N

xn

MN

x

M

xXP )(

N

nMXE )(

N

M

N

Mn

N

nNX 1

1)(var

Hypergeometrické rozdělení H(M,N,n)

Je-li rozsah výběru n oproti počtu jednotek v osudí N malý(provedeme-li třeba jen 10%-ní výběr), pak se hodnota výrazu

ze vzorce pro rozptyl blíží 1. označíme jako p

a hypergeometrické rozdělení lze aproximovat Binomickým

rozdělením s rozptylem

1

N

nN

N

MnBi ,

N

M

N

Mn

N

nNX 1

1)(var

N

M

)1()(var ppnX