Post on 11-Jan-2016
description
ZÁKLADNÍ ROZDĚLENÍ
PRAVDĚPODOBNOSTI
SPOJITÝCH
NÁHODNÝCH VELIČIN
NORMÁLNÍ ROZDĚLENÍ
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
NORMÁLNÍ ROZDĚLENÍ
Aplikuje se tam, kde náhodná veličina
nabývá jakékoliv hodnoty z teoreticky nekonečného
intervalu
- < x < (např. výsledky měření délky, hmotnosti,
tvrdosti, kyselosti atd.).
Na náhodnou veličinu působí s malou intenzitou
řada vzájemně nezávislých náhodných vlivů.
Normální rozdělení N ( , 2 ) závisí na dvou
parametrech, střední hodnotě a rozptylu 2 .
hustota pravděpodobnosti :
f (x) =
distribuční funkce :
F (x) =
Střední hodnota : E ( ) = rozptyl : D ( ) = 2 .
2x
2
1
e2
1
dye2
1 x y
2
12
Příklad: Hustota pravděpodobnosti normálních rozdělení N1(0; 0,25) , s parametry = 0 a 2 = 0,25 ( = 0,5),N2(0; 1) , s parametry = 0 a 2 = 1 ( = 1), N3(0; 4) , s parametry = 0 a 2 = 4 ( = 2).
0,159
0,023
0,309
Příklad: Distribuční funkce normálních rozdělení N1(0; 0,25) , s parametry = 0 a 2 = 0,25 ( = 0,5),N2(0; 1) , s parametry = 0 a 2 = 1 ( = 1), N3(0; 4) , s parametry = 0 a 2 = 4 ( = 2).
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
-4 -3 -2 -1 0 1 2 3 4
0,309
0,159
0,023
V intervalu - , + leží 68,26 % všech pozorování,
mimo tento interval leží 215,87 %, t.j. 31,74 %.
V intervalu - 2, + 2 leží 95,44 % všech pozorování,
mimo tento interval leží 22,28 %, t.j. 4,56 %.
V intervalu - 3, + 3 leží 99,73 % všech pozorování, mimo tento interval leží 20,135 %, t.j. 0,27 % (2 700 ppm).
V intervalu - 4, + 4 leží 99,994 % všech pozorování, mimo tento interval leží 20,003 %, t.j. 0,006 % (60 ppm).
V intervalu - 5, + 5 leží 99,99994 % všech pozorování, mimo tento interval leží 20,00003 %, t.j. 0,00006% (0,6 ppm).
V intervalu - 6, + 6 leží 99,999999999 % všech pozorování, mimo tento interval leží 20,000000001%, t.j. 0,000000002% (0,002 ppm).
68,27%
95,45%
99,73%
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Transformace náhodné veličiny , rozdělené N(, 2),
odstraňuje závislost na parametrech a 2 . Nová náhodná veličina má normální rozdělení N(0,1) se střední hodnotou 0 a rozptylem 1 a nabývá hodnot
Potom hustota pravděpodobnosti :
a distribuční funkce :
Střední hodnota : E ( ) = a rozptyl : D ( ) = 1 .
x
u
2u
2
1
e2
1u
dye2
1u
uy
2
1 2
Tabulka kvantilů rozdělení N(0, 1)
Hodnoty kvantilů u náhodné veličiny , rozdělené N(0, 1), jsou hodnoty u vyhovující rovnici
jsou tabelovány pro hodnoty 0,001 0,999.
Jelikož platí u1- = - u , jsou uvedeny pouze hodnoty kvantilů pro 0,5 1 .
Pro výpočet kvantilů x náhodné veličiny rozdělené N( , 2 ) se použije vztah
x = + u .
u
PŘÍKLAD :
Pro = 0,925 je u = u0,925 = 1,44 ;
pro = 0,075 je u = u0,075 = u1–0,925 = –u0,925 = –1,44 .
Uvažujme náhodnou veličinu rozdělenou N(, 2) = N(3; 0,25).
Potom vzhledem k tomu že = 0,5 je
pro = 0,925 je x = x0,925 = + u = 3 + 1,44 0,5 = 3,72,
pro = 0,075 je x = x0,075 = + u = 3 + (-1,44) 0,5 = 2,28.
Pod hodnotou 3,72 bude ležet v průměru 92,5% všech pozorování,
resp. pod hodnotou 2,28 bude ležet v průměru 7,5% všech pozorování.
POZNÁMKA:
V některých aplikacích, zejména v SPC, se označují kvantily normovaného normálního rozdělení up
symbolem z .
Jsou tabelovány podíly pz pro z což jsou podíly nad
hodnotou + z nebo pod hodnotou – z pro normální rozdělení N(, 2). Hodnota z představuje vzdálenost od střední hodnoty v jednotkách směrodatné odchylky.
Příklad: Pro z = 2, je pz = 0,0228 . Nad hodnotou + 2 , stejně jako pod hodnotou –2 leží v průměru podíl 0,0228 jednotek .
Hustota pravděpodobnosti (u) rozdělení N(0, 1)
Hustoty pravděpodobnosti
normovaného normálního rozdělení N(0,1) jsou tabelovány pro 0 u 3,99 , pro – 3,99 u 0 je
(–u) = (u) .
Pro normální rozdělení N(, 2) je hustota pravděpodobnosti
rovna
2u
2
1
e2
1u
2
x
2
1
e2
1xf
x1
u1
xf
Zakreslení křivky hustoty pravděpodobnosti rozdělení N(, 2) do histogramu
Do histogramu s šířkou třídních intervalů h a celkovým počtem
pozorování n ( n = , nj ; j = 1, 2, ... , k ; jsou třídní četnosti)
zakreslíme křivku normálního rozdělení relativních četností:
případně křivku rozdělení absolutních třídních četností:
k
1jjn
x1
hu1
hxf re,h
x1
hnu1
hn)x(fnxf re,hab,h
Bylo proměřeno n = 200 průměrů čepů z výrobního procesu.
Byl vypočten výběrový průměr = 23,416 mm (odhad )
a směrodatná odchylka s = 0,108 mm (odhad ) .
Údaje byly seskupeny do tříd šířky h = 0,05 mm a sestrojen histogram .
Do histogramu zakreslíme křivku hustoty pravděpodobnosti odpovídající normálnímu rozdělení N(23,416; 0,1082)
Pro bod x = 23,34 mm je
u = ( x - ) / = (23,340 - 23,416) / 0,108 = -0,7037
a (u) = (-0,70) = 0,3123.
Potom
fh,re(x) = h (u) / = f0,05;re(23,34) = 0,05 * 0,3123 / 0,108 = 0,1446
a fh,ab(x) = n fh,re(x) = f0,05,ab(23,34) = 200 * 0,1446 = 28,92.
PŘÍKLAD :
x
0
5
10
15
20
25
30
35
40
45
23,14 23,19 23,24 23,29 23,34 23,39 23,44 23,49 23,54 23,59 23,64
0,000
0,025
0,050
0,075
0,100
0,125
0,150
0,175
0,200
0,225
0,144628,92
Zakreslení křivky normálního rozdělení N(23,416; 0,1082) do histogramu z n = 200 pozorování seskupených do 12 tříd šířky h = 0,05.
Bodové odhady parametrů a Využití normálního rozdělení v praxi předpokládá znalost:
– parametru polohy a – parametru rozptýlení (variability) .
Výstupy z experimentu mohou mít různé formy :
1) Jediný náhodný výběr rozsahu n jednotek : x1, x2, x3, ..., xn .
a) výběrový průměr ;
b) výběrový medián
Me = x(k) , kde k = (n+1)/2 pro n liché a
Me = (x(k) + x(k+1))/2 , kde k = n/2 pro n
sudé ;
c) výběrový rozptyl ;
d) výběrová směrodatná odchylka ;
e) výběrové rozpětí R = xmax - xmin = x(n) - x(1).
n
1iix
n
1x
2n
1ii
2 xx1n
1s
2ss
Odhady :
resp. Me ;
2 s2 ;
s resp. R / d2 .
Konstanty d2 a C4 závislé na rozsahu náhodného výběru n
jsou tabelovány (tabulka č. 2. v ČSN ISO 8258).
x
2) k podskupin stejného rozsahu po n jednotkách ( n1 = n2 = ... = nj = ... = nk = n ) .
podskupinaj
i = 1 i = 2 – i = n výběrovýprůměr
výběrovýmedián
výběrovýrozptyl
výběrovásm. od.
výběrovérozpětí
1 x11 x12 – x1n x1 Me1 s12 s1 R1
2 x21 x22 – x2n x2 Me2 s22 s2 R2
– – – – – – – – – –
k xk1 xk2 – xkn xk Mek sk2 sk Rk
a) celkový výběrový průměr: ;
b) průměrný výběrový medián: ;
k
1j
jxk
1x
k
1jjMe
k
1Me
c) průměrný výběrový rozptyl: ;
d) průměrná výběrová směrodatná odchylka: ;
e) průměrné výběrové rozpětí: .
k
1j
2j
2 sk
1s
k
1jjs
k
1s
k
1jjR
k
1R
Odhady:
resp. ;
2 ;
resp. resp.
1) Konstanty C4 a d2 závislé na rozsahu podskupiny n viz tabulka č. 2. v ČSN ISO 8258.
x Me
2s
2s 4C/s 2d/R
3) k podskupin různého rozsahu nj jednotek (j = 1, 2, …, k)
Celkový počet pozorování je
a) celkový výběrový průměr: ;
b) průměrný výběrový medián: ;
k
1j
jj xnn
1x
k
1jjj Men
n
1Me
podsk.j
i=1i=2–i=nj výběrovýprůměr
výběrovýmedián
výběrovýrozptyl
výběrovásm. od.
výběrovérozpětí
1x11x12–x1n1 x1 Me1 s12 s1 R1
2x21x22–x2n2 x2 Me2 s22 s2 R2
– ––– – – – – – –
k xk1xk2–xknk xk Mek sk2 sk Rk
k
1jjnn
c) průměrný výběrový rozptyl: ;
d) průměrná výběrová směrodatná odchylka: ;
e) průměrné výběrové rozpětí: .
k
1j
2jj
2 s)1n(kn
1s
k
1jjj s)1n(
kn
1s
k
1jjj Rn
n
1R
Odhady:
resp. ;
2 ;
resp. resp.
1) Konstanty C4 a d2 závislé na rozsahu podskupiny n viz tabulka č. 2. v ČSN ISO 8258.
x Me
2s
2s 4C/s 2d/R
Poznámky:
1) Hodnoty C4 a d2 v závislosti na rozsahu výběru jsou
uvedeny v tab. 2 v ČSN ISO 8258.
2) V případě, že podskupiny jsou různého rozsahu
( n1 n2 , ... , nk ) , je celkový počet pozorování
a pak se musí vypočítat vážené hodnoty těchto
koeficientů:
k
1jjnn
k
1j2j2
k
1jj4j4 .)n(dn
n
1d.resp)n(Cn
n
1C
PŘÍKLAD Uvažujme k = 6 podskupin stejného rozsahu n = 5 . Výsledky jsou sestaveny do tabulky, ve které jsou vypočteny průměry podskupin a výběrové směrodatné odchylky sj .
podskupina j
1 2 3 4 5 xj sj
1 1,21,51,41,31,71,42 0,19
2 1,51,81,81,71,61,68 0,13
3 2,12,42,32,02,32,22 0,16
4 1,41,21,31,41,11,28 0,13
5 1,42,21,21,72,21,74 0,46
6 2,12,42,92,62,52,50 0,29
Výpočty:
celkový výběrový průměr : = 1,807 ;
průměrný výběrový rozptyl : = 0,0652 ;
průměrná směrodatná odchylka: = = 0,255 .
Odhady : 1,807 a (0,0652) = 0,255.
x2s
s 2s
POZNÁMKY :
Při analýze výrobního procesu se setkáváme s dalšími charakteristikami:
1) Celkové charakteristiky :
a) celkový výběrový průměr = 1,807
(charakterizuje polohu těžiště souboru vzniklého spojením všech
podskupin za celé sledované období a tedy těžiště procesu za toto
období; je vždy roven průměru výběrových průměrů podskupin ) ;
b) celková směrodatná odchylka stot = 0,493
(charakterizuje variabilitu v souboru vzniklém spojením všech podskupin
za celé sledované období a tedy celkovou variabilitu procesu za toto
období; je obvykle větší než průměrná směrodatná odchylka podskupin,
protože zahrnuje vedle variability uvnitř podskupin i variabilitu mezi
podskupinami) ;
c) průměrná výběrová odchylka = 0,255
(charakterizuje průměrnou variabilitu uvnitř podskupin).
totx
x
s
2) Charakteristiky rozdělení výběrových průměrů :
a) průměr výběrových průměrů = 1,807 ;
b) směrodatná odchylka výběrových průměrů =
0,469
(směrodatná odchylka výběrových průměrů charakterizuje variabilitu
mezi výběrovými průměry podskupin a tedy v podstatě i variabilitu
mezi podskupinami).
x
xs
3) Porovnání odhadů směrodatné odchylky procesu :
a) = 0,255 ;
b) = 0,242 ;
c) = 0,236 .
2s
)n(C/s 4
)n(d/R 2
n C4(n) d2(n)
2 0,7979 1,1280
3 0,8862 1,6930
4 0,9213 2,0590
5 0,9400 2,3260
6 0,9515 2,5340
7 0,9594 2,7040
8 0,9650 2,8470
9 0,9693 2,970010 0,9727 3,0780