ZÁKLADNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÝCH NÁHODNÝCH VELIČIN
description
Transcript of ZÁKLADNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÝCH NÁHODNÝCH VELIČIN
ZÁKLADNÍ ROZDĚLENÍ
PRAVDĚPODOBNOSTI
SPOJITÝCH
NÁHODNÝCH VELIČIN
NORMÁLNÍ ROZDĚLENÍ
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
NORMÁLNÍ ROZDĚLENÍ
Aplikuje se tam, kde náhodná veličina
nabývá jakékoliv hodnoty z teoreticky nekonečného
intervalu
- < x < (např. výsledky měření délky, hmotnosti,
tvrdosti, kyselosti atd.).
Na náhodnou veličinu působí s malou intenzitou
řada vzájemně nezávislých náhodných vlivů.
Normální rozdělení N ( , 2 ) závisí na dvou
parametrech, střední hodnotě a rozptylu 2 .
hustota pravděpodobnosti :
f (x) =
distribuční funkce :
F (x) =
Střední hodnota : E ( ) = rozptyl : D ( ) = 2 .
2x
2
1
e2
1
dye2
1 x y
2
12
Příklad: Hustota pravděpodobnosti normálních rozdělení N1(0; 0,25) , s parametry = 0 a 2 = 0,25 ( = 0,5),N2(0; 1) , s parametry = 0 a 2 = 1 ( = 1), N3(0; 4) , s parametry = 0 a 2 = 4 ( = 2).
0,159
0,023
0,309
Příklad: Distribuční funkce normálních rozdělení N1(0; 0,25) , s parametry = 0 a 2 = 0,25 ( = 0,5),N2(0; 1) , s parametry = 0 a 2 = 1 ( = 1), N3(0; 4) , s parametry = 0 a 2 = 4 ( = 2).
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
-4 -3 -2 -1 0 1 2 3 4
0,309
0,159
0,023
V intervalu - , + leží 68,26 % všech pozorování,
mimo tento interval leží 215,87 %, t.j. 31,74 %.
V intervalu - 2, + 2 leží 95,44 % všech pozorování,
mimo tento interval leží 22,28 %, t.j. 4,56 %.
V intervalu - 3, + 3 leží 99,73 % všech pozorování, mimo tento interval leží 20,135 %, t.j. 0,27 % (2 700 ppm).
V intervalu - 4, + 4 leží 99,994 % všech pozorování, mimo tento interval leží 20,003 %, t.j. 0,006 % (60 ppm).
V intervalu - 5, + 5 leží 99,99994 % všech pozorování, mimo tento interval leží 20,00003 %, t.j. 0,00006% (0,6 ppm).
V intervalu - 6, + 6 leží 99,999999999 % všech pozorování, mimo tento interval leží 20,000000001%, t.j. 0,000000002% (0,002 ppm).
68,27%
95,45%
99,73%
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Transformace náhodné veličiny , rozdělené N(, 2),
odstraňuje závislost na parametrech a 2 . Nová náhodná veličina má normální rozdělení N(0,1) se střední hodnotou 0 a rozptylem 1 a nabývá hodnot
Potom hustota pravděpodobnosti :
a distribuční funkce :
Střední hodnota : E ( ) = a rozptyl : D ( ) = 1 .
x
u
2u
2
1
e2
1u
dye2
1u
uy
2
1 2
Tabulka kvantilů rozdělení N(0, 1)
Hodnoty kvantilů u náhodné veličiny , rozdělené N(0, 1), jsou hodnoty u vyhovující rovnici
jsou tabelovány pro hodnoty 0,001 0,999.
Jelikož platí u1- = - u , jsou uvedeny pouze hodnoty kvantilů pro 0,5 1 .
Pro výpočet kvantilů x náhodné veličiny rozdělené N( , 2 ) se použije vztah
x = + u .
u
PŘÍKLAD :
Pro = 0,925 je u = u0,925 = 1,44 ;
pro = 0,075 je u = u0,075 = u1–0,925 = –u0,925 = –1,44 .
Uvažujme náhodnou veličinu rozdělenou N(, 2) = N(3; 0,25).
Potom vzhledem k tomu že = 0,5 je
pro = 0,925 je x = x0,925 = + u = 3 + 1,44 0,5 = 3,72,
pro = 0,075 je x = x0,075 = + u = 3 + (-1,44) 0,5 = 2,28.
Pod hodnotou 3,72 bude ležet v průměru 92,5% všech pozorování,
resp. pod hodnotou 2,28 bude ležet v průměru 7,5% všech pozorování.
POZNÁMKA:
V některých aplikacích, zejména v SPC, se označují kvantily normovaného normálního rozdělení up
symbolem z .
Jsou tabelovány podíly pz pro z což jsou podíly nad
hodnotou + z nebo pod hodnotou – z pro normální rozdělení N(, 2). Hodnota z představuje vzdálenost od střední hodnoty v jednotkách směrodatné odchylky.
Příklad: Pro z = 2, je pz = 0,0228 . Nad hodnotou + 2 , stejně jako pod hodnotou –2 leží v průměru podíl 0,0228 jednotek .
Hustota pravděpodobnosti (u) rozdělení N(0, 1)
Hustoty pravděpodobnosti
normovaného normálního rozdělení N(0,1) jsou tabelovány pro 0 u 3,99 , pro – 3,99 u 0 je
(–u) = (u) .
Pro normální rozdělení N(, 2) je hustota pravděpodobnosti
rovna
2u
2
1
e2
1u
2
x
2
1
e2
1xf
x1
u1
xf
Zakreslení křivky hustoty pravděpodobnosti rozdělení N(, 2) do histogramu
Do histogramu s šířkou třídních intervalů h a celkovým počtem
pozorování n ( n = , nj ; j = 1, 2, ... , k ; jsou třídní četnosti)
zakreslíme křivku normálního rozdělení relativních četností:
případně křivku rozdělení absolutních třídních četností:
k
1jjn
x1
hu1
hxf re,h
x1
hnu1
hn)x(fnxf re,hab,h
Bylo proměřeno n = 200 průměrů čepů z výrobního procesu.
Byl vypočten výběrový průměr = 23,416 mm (odhad )
a směrodatná odchylka s = 0,108 mm (odhad ) .
Údaje byly seskupeny do tříd šířky h = 0,05 mm a sestrojen histogram .
Do histogramu zakreslíme křivku hustoty pravděpodobnosti odpovídající normálnímu rozdělení N(23,416; 0,1082)
Pro bod x = 23,34 mm je
u = ( x - ) / = (23,340 - 23,416) / 0,108 = -0,7037
a (u) = (-0,70) = 0,3123.
Potom
fh,re(x) = h (u) / = f0,05;re(23,34) = 0,05 * 0,3123 / 0,108 = 0,1446
a fh,ab(x) = n fh,re(x) = f0,05,ab(23,34) = 200 * 0,1446 = 28,92.
PŘÍKLAD :
x
0
5
10
15
20
25
30
35
40
45
23,14 23,19 23,24 23,29 23,34 23,39 23,44 23,49 23,54 23,59 23,64
0,000
0,025
0,050
0,075
0,100
0,125
0,150
0,175
0,200
0,225
0,144628,92
Zakreslení křivky normálního rozdělení N(23,416; 0,1082) do histogramu z n = 200 pozorování seskupených do 12 tříd šířky h = 0,05.
Bodové odhady parametrů a Využití normálního rozdělení v praxi předpokládá znalost:
– parametru polohy a – parametru rozptýlení (variability) .
Výstupy z experimentu mohou mít různé formy :
1) Jediný náhodný výběr rozsahu n jednotek : x1, x2, x3, ..., xn .
a) výběrový průměr ;
b) výběrový medián
Me = x(k) , kde k = (n+1)/2 pro n liché a
Me = (x(k) + x(k+1))/2 , kde k = n/2 pro n
sudé ;
c) výběrový rozptyl ;
d) výběrová směrodatná odchylka ;
e) výběrové rozpětí R = xmax - xmin = x(n) - x(1).
n
1iix
n
1x
2n
1ii
2 xx1n
1s
2ss
Odhady :
resp. Me ;
2 s2 ;
s resp. R / d2 .
Konstanty d2 a C4 závislé na rozsahu náhodného výběru n
jsou tabelovány (tabulka č. 2. v ČSN ISO 8258).
x
2) k podskupin stejného rozsahu po n jednotkách ( n1 = n2 = ... = nj = ... = nk = n ) .
podskupinaj
i = 1 i = 2 – i = n výběrovýprůměr
výběrovýmedián
výběrovýrozptyl
výběrovásm. od.
výběrovérozpětí
1 x11 x12 – x1n x1 Me1 s12 s1 R1
2 x21 x22 – x2n x2 Me2 s22 s2 R2
– – – – – – – – – –
k xk1 xk2 – xkn xk Mek sk2 sk Rk
a) celkový výběrový průměr: ;
b) průměrný výběrový medián: ;
k
1j
jxk
1x
k
1jjMe
k
1Me
c) průměrný výběrový rozptyl: ;
d) průměrná výběrová směrodatná odchylka: ;
e) průměrné výběrové rozpětí: .
k
1j
2j
2 sk
1s
k
1jjs
k
1s
k
1jjR
k
1R
Odhady:
resp. ;
2 ;
resp. resp.
1) Konstanty C4 a d2 závislé na rozsahu podskupiny n viz tabulka č. 2. v ČSN ISO 8258.
x Me
2s
2s 4C/s 2d/R
3) k podskupin různého rozsahu nj jednotek (j = 1, 2, …, k)
Celkový počet pozorování je
a) celkový výběrový průměr: ;
b) průměrný výběrový medián: ;
k
1j
jj xnn
1x
k
1jjj Men
n
1Me
podsk.j
i=1i=2–i=nj výběrovýprůměr
výběrovýmedián
výběrovýrozptyl
výběrovásm. od.
výběrovérozpětí
1x11x12–x1n1 x1 Me1 s12 s1 R1
2x21x22–x2n2 x2 Me2 s22 s2 R2
– ––– – – – – – –
k xk1xk2–xknk xk Mek sk2 sk Rk
k
1jjnn
c) průměrný výběrový rozptyl: ;
d) průměrná výběrová směrodatná odchylka: ;
e) průměrné výběrové rozpětí: .
k
1j
2jj
2 s)1n(kn
1s
k
1jjj s)1n(
kn
1s
k
1jjj Rn
n
1R
Odhady:
resp. ;
2 ;
resp. resp.
1) Konstanty C4 a d2 závislé na rozsahu podskupiny n viz tabulka č. 2. v ČSN ISO 8258.
x Me
2s
2s 4C/s 2d/R
Poznámky:
1) Hodnoty C4 a d2 v závislosti na rozsahu výběru jsou
uvedeny v tab. 2 v ČSN ISO 8258.
2) V případě, že podskupiny jsou různého rozsahu
( n1 n2 , ... , nk ) , je celkový počet pozorování
a pak se musí vypočítat vážené hodnoty těchto
koeficientů:
k
1jjnn
k
1j2j2
k
1jj4j4 .)n(dn
n
1d.resp)n(Cn
n
1C
PŘÍKLAD Uvažujme k = 6 podskupin stejného rozsahu n = 5 . Výsledky jsou sestaveny do tabulky, ve které jsou vypočteny průměry podskupin a výběrové směrodatné odchylky sj .
podskupina j
1 2 3 4 5 xj sj
1 1,21,51,41,31,71,42 0,19
2 1,51,81,81,71,61,68 0,13
3 2,12,42,32,02,32,22 0,16
4 1,41,21,31,41,11,28 0,13
5 1,42,21,21,72,21,74 0,46
6 2,12,42,92,62,52,50 0,29
Výpočty:
celkový výběrový průměr : = 1,807 ;
průměrný výběrový rozptyl : = 0,0652 ;
průměrná směrodatná odchylka: = = 0,255 .
Odhady : 1,807 a (0,0652) = 0,255.
x2s
s 2s
POZNÁMKY :
Při analýze výrobního procesu se setkáváme s dalšími charakteristikami:
1) Celkové charakteristiky :
a) celkový výběrový průměr = 1,807
(charakterizuje polohu těžiště souboru vzniklého spojením všech
podskupin za celé sledované období a tedy těžiště procesu za toto
období; je vždy roven průměru výběrových průměrů podskupin ) ;
b) celková směrodatná odchylka stot = 0,493
(charakterizuje variabilitu v souboru vzniklém spojením všech podskupin
za celé sledované období a tedy celkovou variabilitu procesu za toto
období; je obvykle větší než průměrná směrodatná odchylka podskupin,
protože zahrnuje vedle variability uvnitř podskupin i variabilitu mezi
podskupinami) ;
c) průměrná výběrová odchylka = 0,255
(charakterizuje průměrnou variabilitu uvnitř podskupin).
totx
x
s
2) Charakteristiky rozdělení výběrových průměrů :
a) průměr výběrových průměrů = 1,807 ;
b) směrodatná odchylka výběrových průměrů =
0,469
(směrodatná odchylka výběrových průměrů charakterizuje variabilitu
mezi výběrovými průměry podskupin a tedy v podstatě i variabilitu
mezi podskupinami).
x
xs
3) Porovnání odhadů směrodatné odchylky procesu :
a) = 0,255 ;
b) = 0,242 ;
c) = 0,236 .
2s
)n(C/s 4
)n(d/R 2
n C4(n) d2(n)
2 0,7979 1,1280
3 0,8862 1,6930
4 0,9213 2,0590
5 0,9400 2,3260
6 0,9515 2,5340
7 0,9594 2,7040
8 0,9650 2,8470
9 0,9693 2,970010 0,9727 3,0780