TEORETICKÉ MODELY některých DISKRÉTNÍCH NV
-
Upload
lisandra-church -
Category
Documents
-
view
35 -
download
4
description
Transcript of TEORETICKÉ MODELY některých DISKRÉTNÍCH NV
Teoretické modely diskrétních náhodných veličin
Veličiny, kterými se zabýváme, bývají nejrůznější povahy.Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti.
Typové modely takových rozdělení byly stanoveny teoreticky a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně.
Mějme naměřená reálná (empirická) data - obvykle výběrový soubor z nějaké populace. Snažíme se nalézt teoretické rozdělení a stanovit jeho parametry tak, aby co nejlépe odpovídalo našemu reálnému rozdělení četností.Jinými slovy: Vybíráme takový „model rozdělení“, který vystihuje povahu našich reálných (empirických) dat.
Rovnoměrné diskrétní rozdělení
Náhodná veličina má rovnoměrné diskrétní rozdělení, jestliže k - hodnot, kterých může nabývat, se vyskytujes pravděpodobností
Rozdělení je modelem pokusů házení mincí (k=2) nebo házení hrací kostkou (k=6)
Střední hodnota je
a rozptyl je var(X)=E[X-E(X)]2 = E(X2) - [E(X)]2
kik
xXP i ...,,2,1,1
)(
k
iii
k
ii x
kxXPxXE
11
1)()(
2
112
2 11)var(
k
ii
k
ii x
kx
kX
Příklad: Rovnoměrné diskrétní rozdělení
Hod mincí 1. stranu označíme 1 2. stranu označíme 2
Hod kostkou
5,12
3
2
1)(
2
1
i
ixXE
5,36
21
6
1)(
6
1
i
ixXE
25,04
9
2
5
2
1
2
1)var(
22
1
2
12
2
ii
ii xxX
92,236
441691
36
21
6
91
6
1
6
1)var(
226
1
6
12
2
ii
ii xxX
Binomické rozdělení Bi (n; π)
Toto rozdělení má náhodná veličina X, která vznikne jako součet n nezávislých alternativně* rozdělených náhodných veličin se stejným parametrem π (pravděpodobnost úspěchu).
Diskrétní náhodná veličina X má binomické rozdělenís parametry n, π, π Є (0, 1), resp.nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností
Střední hodnota:
Rozptyl:
*Alternativně - mají jen 2 možné výsledky: úspěch x neúspěch
xnx
x
nxXP
1)(
nXE )(
)1()(var nX
),(),( nBnBi
Příklad: Hokejisté mají proměnit 5 trestných střílení. Jsou vybráni hráči, u nichž pravděpodobnost vstřelení branky je 0,8. Jaká je pravděpodobnost, že vstřelí branku ze všech pěti pokusů?
Podle pravidla násobení pravděpodobností: p = 0,8*0,8*0,8*0,8*0,8
Jaká by byla pravděpodobnost, že vstřelí branku jen ve třech stříleních? Z definice binomického rozdělení: p = počet možností * (0,8)3 * (0,2)2
Binomické rozdělení je rozdělením nezávislých pokusů alternativní veličiny se stejnou pravděpodobností úspěchu.
Binomické rozdělení Bi (n; π)
xnx
x
nxXP
1)( 353 8,018,0
3
5)3(
XP
Binomické rozdělení Bi (n; π)
Máme alternativní veličinu např. indikující, že daná osoba
trpí diabetem s pravděpodobností p = π a osoba je zdravá s pravděpodobností p = 1 - π
Předpoklady: všechny osoby mají stejnou pravděpodobnost výskytu onemocnění
výskyt diabetes je u jednotlivých osob nezávislý(nejedná se o nakažlivou chorobu)
Sledovaná populace: n osob Ve výběru bude: x nemocných
Pravděpodobnost, že X = x
xnx
x
nxXP
1)(
Binomické rozdělení - grafické znázornění
0 10 20 30
π=0,5 π=0,01 π=0,2 π=0,95
xnx
x
nxXP
)1()(
X … náhodná veličinax … hodnota NV, které dosáhne (např. pro 30 měření 0, 1, 2, …, 30)π … pravděpodobnost, s jakou je jev pozorován1-π … pravděpodobnost, s jakou jev nenastane
Alternativní (Bernoulliho) rozdělení
je zvláštním případem Binomického rozdělení a nazývá se Alternativní neboli Bernoulliho rozdělení.
Alternativní veličina – indikátor nemoci, symptomu, … .
NV může nabývat pouze hodnoty 1 s pravděpodobností pnebo hodnoty 0 s pravděpodobností (1-p)
Střední hodnota E(X) = pRozptyl var(X) = p(1-p)
PŘ1: počet lvů při hodu 1 mincí - buď padne 1 lev nebo žádný, p = 0,5
PŘ2: riziko onemocnění, pravděpodobnost výhry, ...
Kde a … počet pozitivních odpovědí (nemocných, losů, které vyhrávají). b … počet negativních odpovědí (počet zdravých, losů bez výhry)
ba
ap
),1( Bi
U předchozího binomického rozdělení jsme sledovali soubor konečného, často malého rozsahu. Ale často se stává, že sledovaná populace může být velmi rozsáhlá nebo dokonce „nekonečná“, např. sledujeme počet onemocnění klíšťovou encefalitidou v populaci ČR v každém týdnu aktuálního roku.
Parametr n v tomto případě neznáme a rozdělení veličiny můžeme popsat vzorcem , kde
λ je jediným parametrem tohoto rozdělení a vyjadřuje pravděpodobnost, že ve výběru bude x nemocných.Rozdělení se nazývá Poissonovo rozdělení.
Poissonovo rozdělení
ex
xXPx
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
Diskrétní náhodná veličina X má Poissonovo rozdělenís parametrem λ > 0, nabývá-li hodnot x = 0, 1, 2, …
s pravděpodobností
Základní charakteristikystřední hodnota a rozptyl:
Distribuční funkce (kumulativní pravděpodobnosti):
Poissonovo rozdělení je rozdělením řídkých jevů.
ex
xXPx
!)(
)(var)( XXE
Poissonovo rozdělení )(Po
xt
t
texF
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
Spolu s Binomickým rozdělením se používá nejčastěji pro popis veličin, které vyjadřují počet nalezených objektů našeho zájmu:
- počet hovorů za jednotku času v telefonní ústředně- počet vadných výrobků- počet kazů na látce- počet částic v jednotce objemu
Pro velká n a malá p lze Binomické rozdělení aproximovat Poissonovým rozdělením Po (λ = np)
Vztah platí i opačně – Poissonovo rozdělení můžeme aproximovat Binomickým: - zvolíme dostatečně velké n (řádově 100 – 1000 x větší než λ) a p vypočteme jako p = λ/n
Poissonovo rozdělení )(Po
Př. Sledujeme počet infekcí horních dýchacích cest dětí během prvních tří let jejich věku ve velmi rozsáhlé populaci a z těchto sledování stanovíme pravděpodobnost tohoto onemocnění a označíme ji λ.
Pravděpodobnost, že ve výběru bude x nemocných, vypočteme pomocí Poissonova rozdělení
za předpokladů: všechny děti mají stejnou pravděpodobnost onemocnění výskyt onemocnění je u jednotlivých osob nezávislý
Poissonovo rozdělení
ex
xXPx
!)(
Německý statistik Borkiewicz sledoval po dobu 10 let ve 20-ti německých armádních sborech zabití vojenských osob úderem koňského kopyta
Očekávaná hodnota λ (lambda) byla podle propočtů počet mrtvých / počet sledování 122 / 200 = 0,61
Skutečnost Propočet0 mrtvých 109 109
1 mrtvý 65 662 mrtví 22 203 mrtví 3 44 mrtví 1 0,6
ex
xXPx
!)(Poissonovo rozdělení
Poissonovo rozložení - smrt po úderu koňským kopytem
Počet úmrtí Vypočtený počet
vojenských sborů
Porovnání se skutečným sledováním
0 0,543 108,7 109
1 0,331 66,3 65
2 0,101 20,2 22
3 0,0205 4,1 3
4 0,0031 0,6 1
5 0,00038 0,1 0
6 0,000038 0,0 0
ex
xXPx
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
MODŘE - skutečnostŠEDĚ – propočet
Poissonovo rozložení - smrt po úderu koňským kopytem
ex
xXPx
!)(
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1 3 5 7 9 11 13 15 17 19 21 23
λ=0,5
λ=1
λ=2
λ=4
λ=10
Frekvenční funkce Poissonova rozložení v závislosti na λ
ex
xXPx
!)(
Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek
Příklad: Do podnikové telefonní ústředny přichází v průměru 120 hovorů za hodinu. Vypočtěte, jaká je pravděpodobnost:
a) že za půl minuty nepřijde hovorb) že přijdou méně než tři hovory
Řešení: 120 hovorů za hodinu znamená 1 hovor za půl minuty: λ = 1 Jedná se o řídký náhodný jev, proto ho můžeme modelovat Poissonovým rozdělením.Pro hledaný časový interval půl minuty, tj, λ=1 se vzorec zjednoduší na
Pro X=0 je
Pro X=1 je
Pro X=2 je
a) P(X=0) = 0,368 b) P(X<3) = 0,368+0,368+0,184 = 0,92
ex
xXPx
!)(Poissonovo rozdělení - příklad
exe
xxXP
x
!
1
!
1)( 1
368,01
!0
1)0(
eeXP
368,01
!1
1)1(
eeXP
184,02
1
!2
1)1(
eeXP
Multinomické rozdělení
Příklad:
sledujeme nominální veličinu rodinný stav matkysvobodná, vdaná, rozvedená, vdova
Pravděpodobnost, že z n – matek bude právěk1 svobodných, k2 vdaných, k3 rozvedených a k4 vdov vyjadřuje vzorec:
P(X1=k1, X2=k2, X3=k3, X4=k4) =
43214321
4321 !!!!
! kkkk ppppkkkk
n
Hypergeometrické rozdělení H(M,N,n)
Mějme: N předmětů, z tohoM předmětů jednoho druhuN - M předmětů druhého druhu
Vylosujeme n předmětů bez vracení, kde je x - předmětů prvního druhu, např. x = 0 znamená, že 1. druh nebyl tažen.Sledujeme počet úspěchů x v n - závislých pokusech
Ne všechny situace jsou možné, musíme stanovit podmínky.
Příklad 1: Z osudí, ve kterém je N kuliček, z toho M bílých, vybíráme náhodně n jednotek a ptáme se, kolik je mezi nimi bílých kuliček. (Losovat můžeme postupně, ale důležité je, že kuličky zpět nevracíme).
Příklad 2: Losování sportkyPředměty prvního druhu jsou označeny veřejným losováním ve hře sportka. Výběrem čísel na tiketu jsme losovali právě tyto předměty prvního druhu.
Hypergeometrické rozdělení H(M,N,n)
Diskrétní náhodná veličina X má hypergeometrické rozdělenís parametry M, N, n, kde M, N, n jsou přirozená čísla a n Є (0, M), nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností
Základní charakteristiky:
Střední hodnota:
Rozptyl:
n
N
xn
MN
x
M
xXP )(
N
nMXE )(
N
M
N
Mn
N
nNX 1
1)(var
Hypergeometrické rozdělení H(M,N,n)
Je-li rozsah výběru n oproti počtu jednotek v osudí N malý(provedeme-li třeba jen 10%-ní výběr), pak se hodnota výrazu
ze vzorce pro rozptyl blíží 1. označíme jako p
a hypergeometrické rozdělení lze aproximovat Binomickým
rozdělením s rozptylem
1
N
nN
N
MnBi ,
N
M
N
Mn
N
nNX 1
1)(var
N
M
)1()(var ppnX