Přednáška 4 – první část

39
Přednáška 4 – první část Vybraná rozdělení diskrétní náhodné veličiny Alternativní Binomické Hypergeometrické Negativně binomické Geometrické Poissonovo

description

Přednáška 4 – první část. Vybraná rozdělení diskrétní náhodné veličiny Alternativní Binomické Hypergeometrické Negativně binomické Geometrické Poissonovo. Opakování Náhodná veličina. Co je to náhodná veličina (dále NV)? Číselné vyjádření výsledku náhodného pokusu. - PowerPoint PPT Presentation

Transcript of Přednáška 4 – první část

Page 1: Přednáška  4 –  první část

Přednáška 4 – první část

Vybraná rozdělení diskrétní náhodné veličiny• Alternativní• Binomické• Hypergeometrické• Negativně binomické• Geometrické• Poissonovo

Page 2: Přednáška  4 –  první část

OpakováníNáhodná veličina

• Co je to náhodná veličina (dále NV)?– Číselné vyjádření výsledku náhodného pokusu.

• Jaké základní typy náhodných veličin známe?– Diskrétní NV (dále DNV) a spojité NV (dále SNV).

• Co je to rozdělení pravděpodobnosti?– Předpis, kterým charakterizujeme pravděpodobnost jevů, jež lze touto

náhodnou veličinou popsat.

Page 3: Přednáška  4 –  první část

OpakováníNáhodná veličina

• Jak lze popsat rozdělení pravděpodobnosti DNV?– Distribuční funkce pravděpodobnostní funkce .

• Jak lze popsat rozdělení pravděpodobnosti SNV?– Distribuční funkce hustota pravděpodobnosti .

• Jaké základní číselné charakteristiky používáme pro popis NV?– Střední hodnota , rozptyl , směrodatná odchylka , p-kvantily .

Page 4: Přednáška  4 –  první část

OpakováníNáhodná veličina

• Co nám říká Čebyševova nerovnost?

neboli

Např.:

Page 5: Přednáška  4 –  první část

Vybraná rozdělení diskrétní náhodné veličiny

Page 6: Přednáška  4 –  první část

Diskrétní náhodná veličinaPříklady

Technika: ― počet vadných integrovaných obvodů ze 100 testovaných (víme-li, že

pravděpodobnost výroby vadného int. obvodu je 0,01)

Biomedicína: ― počet pacientů (ze 100 operovaných), u nichž došlo k vážným

pooperačním komplikacím (víme-li, že pravděpodobnost vážných pooperačních komplikací je 0,03)

Obecně:― počet úspěchů v n (nezávislých) pokusech

Page 7: Přednáška  4 –  první část

Diskrétní náhodná veličinaPříklady

Technika: ― počet šroubů typu M10 mezi 10 vybranými (víme-li, že do dodávky 100

šroubů bylo omylem zařazeno 20 šroubů typu M50)

Biomedicína: ― počet pacientů (z 10 očkovaných) u nichž byla použita prošlá očkovací

látka (víme-li, že v balení bylo 20 dávek očkovací látky, přičemž 5 z nich bylo prošlých)

Obecně:― počet úspěchů v n (závislých) pokusech

Page 8: Přednáška  4 –  první část

Diskrétní náhodná veličinaPříklady

Technika: ― počet správně přenesených bitů předtím než dojde ke 4. chybě (víme-li, že

pravděpodobnost chybného přenosu bitu je 0,12)

Biomedicína: ― počet dobrovolníků, které budeme muset testovat dříve než najdeme 5

dárců s krevní skupinou AB (předpokládejme, že dobrovolníci neznají svou krevní skupinu, pravděpodobnost výskytu krevní skupiny (populační frekvence) krevní skupiny AB je 0,05)

Obecně:― počet (nezávislých) pokusů do k. úspěchů

Page 9: Přednáška  4 –  první část

Diskrétní náhodná veličinaPříklady

Technika: ― počet škrábanců na 1 m2 lakovaného povrchu (víme-li, že průměrně lze

očekávat 3 škrábance na 10 m2)

Biomedicína: ― počet červených krvinek v 10 ml krve ženy (víme-li, že u průměrně lze

pozorovat červených krvinek v 1l krve (u žen))

Obecně:― počet události v časovém intervalu, na ploše, v objemu

Page 10: Přednáška  4 –  první část

Alternativní rozdělení

• nastane-li sledovaný náhodný jev A (budeme říkat, že došlo k výskytu události, resp. že došlo k úspěchu), bude mít náhodná veličina X hodnotu , nenastane-li jev A, bude mít náhodná veličina X hodnotu .

pravděpodobnost úspěchu (parametr rozdělení)

X … počet výskytů daného náhodného jevu (úspěchů) v jednom pokusu

Pravděpodobnostní funkce: Střední hodnota: Rozptyl:

(dokažte!)

Page 11: Přednáška  4 –  první část

Bernoulliho pokusy

• Posloupnost nezávislých pokusů (tj. takových pokusů, kdy úspěch v libovolné skupině pokusů neovlivňuje pravděpodobnost úspěchu v pokusu, který do této skupiny nepatří),

v nichž jev A (úspěch) nastává s pravděpodobností a neúspěch s pravděpodobností .

Page 12: Přednáška  4 –  první část

Motivační příklad

Předpokládejme, že pravděpodobnost narození dívky je 0,49. Jaká je pravděpodobnost, že v rodině s 8 dětmi jsou právě 2 dívky?

Page 13: Přednáška  4 –  první část

Binomické rozdělení

pravděpodobnost úspěchu

X … počet úspěchů v n Bernoulliho pokusech

počet pokusů

Pravděpodobnostní funkce:

Pravděpodobnost výskytu jedné příznivé realizace posloupnosti Bernoulliho pokusů.

Počet příznivých realizací posloupnosti Bernoulliho pokusů.

Page 14: Přednáška  4 –  první část

Binomické rozdělení

X … počet úspěchů v n Bernoulliho pokusech

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

(dokažte!)

pravděpodobnost úspěchu

počet pokusů

Page 15: Přednáška  4 –  první část

Binomické rozdělení

X … počet úspěchů v n Bernoulliho pokusech

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

Příklady: počet chlapců mezi 10 000 novorozenci, počet vadných výrobků mezi 30 testovanými, počet nevzrostlých rostlin ze 100 zasazených cibulek…

Page 16: Přednáška  4 –  první část

Binomické rozdělení - vlastnosti

X … počet úspěchů v n Bernoulliho pokusech

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50

0.2

0.4

0.6

0.8Bi(n=4; π=0,1)

x

P(x)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5-0.2

5.55111512312578E-17

0.2

0.4

0.6Bi(n=4; π=0,5)

x

P(x)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50

0.2

0.4

0.6

0.8

Bi(n=4; π=0,9)

x

P(x)• poz. zešikmené r.• symetrické r.• neg. zešikmené r.

Page 17: Přednáška  4 –  první část

Binomické rozdělení - vlastnosti

X … počet úspěchů v n Bernoulliho pokusech

-1 1 3 5 7 9 11 13 150

0.050.1

0.150.2

0.25

x

P(x)Bi(n=40; π=0,1)

• poz. zešikmené r.• symetrické r.• neg. zešikmené r.

• , s rostoucím n se rozdělení stává více a více symetrickým

Page 18: Přednáška  4 –  první část

Binomická náhodná veličinaPříklad

Předpokládejme, že pravděpodobnost narození dívky je 0,49. Jaká je pravděpodobnost, že v rodině s 8 dětmi jsoua) právě 2 dívky,

Řešení:D … narození dívky (D je náhodný jev)

X … počet dívek mezi 8 dětmi (počet úspěchů v n Bernoulliho pokusech)

Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.

Page 19: Přednáška  4 –  první část

Binomická náhodná veličinaPříklad

Předpokládejme, že pravděpodobnost narození dívky je 0,49. Jaká je pravděpodobnost, že v rodině s 8 dětmi jsoub) alespoň 3 dívky.

Řešení:D … narození dívky (D je náhodný jev)

X … počet dívek mezi 8 dětmi (počet úspěchů v n Bernoulliho pokusech)

Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.

Page 20: Přednáška  4 –  první část

Motivační příklad

Mezi 200 vajíčky určenými pro prodej v jisté maloobchodní prodejně je 50 vajíček prasklých. Jaká je pravděpodobnost, že vybereme-li si náhodně 20 vajec, bude 8 z nich prasklých?

Page 21: Přednáška  4 –  první část

Hypergeometrické rozdělení

• v souboru N prvků je M prvků s danou vlastností a zbylých (N-M) prvků tuto vlastnost nemá. Postupně vybereme ze souboru n prvků, z nichž žádný nevracíme zpět.

X … počet prvků se sledovanou vlastností ve výběru n prvků

počet prvků s danou vlastností

rozsah základního souboru

rozsah výběru

Page 22: Přednáška  4 –  první část

Hypergeometrické rozdělení

• v souboru N prvků je M prvků s danou vlastností a zbylých (N-M) prvků tuto vlastnost nemá. Postupně vybereme ze souboru n prvků, z nichž žádný nevracíme zpět.

X … počet prvků se sledovanou vlastností ve výběru n prvků

Pravděpodobnostní funkce:

počet všech možností, jak vybrat n prvků z N (nezáleží na pořadí)

počet příznivých možností, tj. počet možností jak vybrat k prvků s danou vlastností z M a zároveň (n-k) prvků, které uvedenou vlastnost nemají z (N-M)

Page 23: Přednáška  4 –  první část

Hypergeometrické rozdělení

• v souboru N prvků je M prvků s danou vlastností a zbylých (N-M) prvků tuto vlastnost nemá. Postupně vybereme ze souboru n prvků, z nichž žádný nevracíme zpět.

X … počet prvků se sledovanou vlastností ve výběru n prvků

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

Page 24: Přednáška  4 –  první část

Hypergeometrické rozdělení

• v souboru N prvků je M prvků s danou vlastností a zbylých (N-M) prvků tuto vlastnost nemá. Postupně vybereme ze souboru n prvků, z nichž žádný nevracíme zpět.

X … počet prvků se sledovanou vlastností ve výběru n prvků

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

Příklady: počet vadných výrobků mezi 10 vybranými z dodávky 30 výrobků, mezi nimiž bylo 7 vadných, počet dívek v náhodně vybrané skupině 4 dětí ze třídy, v níž je 6 chlapců a 8 dívek, …

Page 25: Přednáška  4 –  první část

Hypergeometrické rozdělení Možnost aproximace

Je-li , tzv. výběrový poměr, menší než 0,05, lze hypergeometrické rozdělení nahradit binomickým s parametry n a (M/N).

Page 26: Přednáška  4 –  první část

Hypergeometrické rozděleníPříklad

Mezi 200 vajíčky určenými pro prodej v jisté maloobchodní prodejně je 50 vajíček prasklých. Jaká je pravděpodobnost, že vybereme-li si náhodně 20 vajec, bude více než 8 z nich prasklých?

Řešení:X … počet prasklých vajec z 20-ti vybraných (závislé pokusy)

Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.

Page 27: Přednáška  4 –  první část

Negativně binomické (Pascalovo) rozdělení

X … počet Bernoulliho pokusů do k-tého výskytu události (úspěchu), včetně k-tého výskytu.

𝑋→𝑁𝐵(𝑘;𝜋)

Pravděpodobnostní funkce:

pravděpodobnost úspěchu

požadovaný počet úspěchů

? ? … ? úspěch

(k-1) úspěchů v n Bernoulliho pokusech

k. úspěch

Page 28: Přednáška  4 –  první část

Negativně binomické (Pascalovo) rozdělení

X … počet Bernoulliho pokusů do k-tého výskytu události (úspěchu), včetně k-tého výskytu.

𝑋→𝑁𝐵(𝑘;𝜋)

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

Příklady: počet dárců neznajících svou krevní skupinu, které musíte testovat proto, abyste našli 4 dárce s krevní skupinou 0, počet cestujících, které musí revizor zkontrolovat do chvíle, než najde 10 černých pasažérů, …

Page 29: Přednáška  4 –  první část

Negativně binomické rozděleníPříklad

Dle http://ksicht.natur.cuni.cz/serialy/detektivni-chemie/3 je pravděpodobnost výskytu krevní skupiny A+ 35%. V polní nemocnici nutně potřebují najít 3 dárce krve s touto krevní skupinou. Potenciálních dárců je dostatek, nikdo z nich však nezná svou krevní skupinu. Jaká je pravděpodobnost, že pro nalezení 3 dárců krevní skupiny A+, budeme muset postupně vyšetřit více než 7 a méně než 12 potenciálních dárců?

Řešení:X … počet osob, které musíme vyšetřit, chceme-li najít 3 dárce s krevní skupinou A+

Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.

Page 30: Přednáška  4 –  první část

POZOR!!!

V případě negativně binomické náhodné veličiny není definice ustálená. Někteří statistici (popř. statistický software) ji definují jako počet neúspěchů před k-tým úspěchem.

Jak se to projeví v praktickém výpočtu pravděpodobnostní funkce?

Page 31: Přednáška  4 –  první část

Geometrické rozdělení

• Geometrické rozdělení je speciálním typem negativně binomického rozdělení pro k=1.

X … počet Bernoulliho pokusů do prvního výskytu události (úspěchu), včetně.

𝑋→𝐺𝑒 (𝜋)

pravděpodobnost úspěchu

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

Page 32: Přednáška  4 –  první část

Geometrické rozdělení

• Geometrické rozdělení je speciálním typem negativně binomického rozdělení pro k=1.

X … počet Bernoulliho pokusů do prvního výskytu události (úspěchu), včetně.

𝑋→𝐺𝑒 (𝜋)

Pravděpodobnostní funkce:

Střední hodnota: Rozptyl:

Příklady: počet volání nutných k tomu, abychom se dovolali do televizní soutěže, počet řidičů, kteří podstoupí test na obsah alkoholu v krvi do doby, než bude nalezen první podnapilý řidič, …

Page 33: Přednáška  4 –  první část

Poissonův proces

Bodový proces- Sledujeme chod procesu, v němž čas od času dochází k nějaké význačné

události.

- Registrujeme počet události v časovém intervalu

Jako Poissonův proces označujeme proces, který je:• ordinární – tj. pravděpodobnost výskytu více než jedné události v limitně

krátkém časovém intervalu je nulová. (tzv. řídké jevy),• stacionární – tj. rychlost výskytu událostí je konstantní v průběhu celého

sledovaného intervalu,• beznásledný – tj. pravděpodobnost výskytu události není závislá na čase,

který uplynul od minulé události.

𝑡 0 𝑡1𝑡 2 𝑡𝑛…

Page 34: Přednáška  4 –  první část

Poissonův proces

• Rychlost výskytu události je parametrem Poissonova procesu.• Poissonův proces lze obdobně jako v časovém intervalu definovat na

libovolné uzavřené prostorové oblasti (na ploše, v objemu).

Page 35: Přednáška  4 –  první část

Poissonovo rozdělení

• Definujme si náhodný pokus jako Poissonův proces (nezávislé události probíhající v čase t, s rychlostí výskytu λ; popř. nezávislé události objevující se na ploše t, resp. v objemu t s hustotou výskytu λ). Pak

X … počet výskytu události v uzavřené oblasti (v čase, na ploše, v objemu)

𝑋→𝑃𝑜 ( 𝜆𝑡 )

rychlost výskytu události v Poissonově procesu

velikost uzavřené oblasti

Pravděpodobnostní funkce:

Střední hodnota, rozptyl:

Page 36: Přednáška  4 –  první část

Poissonovo rozdělení

• Definujme si náhodný pokus jako Poissonův proces (nezávislé události probíhající v čase t, s rychlostí výskytu λ; popř. nezávislé události objevující se na ploše t, resp. v objemu t s hustotou výskytu λ). Pak

X … počet výskytu události v uzavřené oblasti (v čase, na ploše, v objemu)

𝑋→𝑃𝑜 ( 𝜆𝑡 )

Pravděpodobnostní funkce:

Střední hodnota, rozptyl:

Příklady: počet pacientů ošetřených během dopoledních ordinačních hodin,počet mikrodefektů na zadaném vzorku materiálu, počet mikroorganismů v 1 dl vody, …

Page 37: Přednáška  4 –  první část

Aproximace binomického rozdělení rozdělením Poissonovým

• Poissonovým rozdělením lze velmi dobře aproximovat binomické rozdělení pro případ, že počet pokusů n je dostatečně velký a pravděpodobnost výskytu události (úspěchu) je dostatečně malá . V takovém případě je .

Page 38: Přednáška  4 –  první část

Poissonovo rozděleníPříklad

V jisté nemocnici se průměrně 30 krát ročně vyskytne porucha srdeční činnosti po určité operaci. Předpokládejme, že se jednotlivé poruchy srdeční činnosti po dané operaci vyskytují nezávisle na sobě, s konstantní rychlosti výskytu. Určete pravděpodobnost, že se v této nemocnici vyskytne příští měsíc nejvýše 1 takováto porucha.

Řešení:X … počet poruch srdeční činnosti během měsíce (po dané operaci, v dané nemocnici)

Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.

Page 39: Přednáška  4 –  první část

Vybraná rozdělení diskrétní náhodné veličinyPřehled

Popis Podmínky Název NV X

počet úspěchů v n pokusech

nezávislé pokusyAlternativní - Binomická -

závislé pokusy Hypergeometrická -

počet pokusů do k. úspěchu (včetně) nezávislé pokusy

Geometrická - Negativně binomická (Pascalova) -

počet události v uzavřené oblasti (v čase, na ploše, v objemu)

ordinarita, stacionarita, beznáslednost procesu Poissonova -