ZÁKLADNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÝCH NÁHODNÝCH VELIČIN

ZÁKLADNÍ ROZDĚLENÍ

PRAVDĚPODOBNOSTI

SPOJITÝCH

NÁHODNÝCH VELIČIN

NORMÁLNÍ ROZDĚLENÍ

NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ

NORMÁLNÍ ROZDĚLENÍ

Aplikuje se tam, kde náhodná veličina

nabývá jakékoliv hodnoty z teoreticky nekonečného

intervalu

- < x < (např. výsledky měření délky, hmotnosti,

tvrdosti, kyselosti atd.).

Na náhodnou veličinu působí s malou intenzitou

řada vzájemně nezávislých náhodných vlivů.

Normální rozdělení N ( , 2 ) závisí na dvou

parametrech, střední hodnotě a rozptylu 2 .

hustota pravděpodobnosti :

f (x) =

distribuční funkce :

F (x) =

Střední hodnota : E ( ) = rozptyl : D ( ) = 2 .

2x

2

1

e2

1

dye2

1 x y

2

12

Příklad: Hustota pravděpodobnosti normálních rozdělení N1(0; 0,25) , s parametry = 0 a 2 = 0,25 ( = 0,5),N2(0; 1) , s parametry = 0 a 2 = 1 ( = 1), N3(0; 4) , s parametry = 0 a 2 = 4 ( = 2).

0,159

0,023

0,309

Příklad: Distribuční funkce normálních rozdělení N1(0; 0,25) , s parametry = 0 a 2 = 0,25 ( = 0,5),N2(0; 1) , s parametry = 0 a 2 = 1 ( = 1), N3(0; 4) , s parametry = 0 a 2 = 4 ( = 2).

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

-4 -3 -2 -1 0 1 2 3 4

0,309

0,159

0,023

V intervalu - , + leží 68,26 % všech pozorování,

mimo tento interval leží 215,87 %, t.j. 31,74 %.

V intervalu - 2, + 2 leží 95,44 % všech pozorování,

mimo tento interval leží 22,28 %, t.j. 4,56 %.

V intervalu - 3, + 3 leží 99,73 % všech pozorování, mimo tento interval leží 20,135 %, t.j. 0,27 % (2 700 ppm).

V intervalu - 4, + 4 leží 99,994 % všech pozorování, mimo tento interval leží 20,003 %, t.j. 0,006 % (60 ppm).

V intervalu - 5, + 5 leží 99,99994 % všech pozorování, mimo tento interval leží 20,00003 %, t.j. 0,00006% (0,6 ppm).

V intervalu - 6, + 6 leží 99,999999999 % všech pozorování, mimo tento interval leží 20,000000001%, t.j. 0,000000002% (0,002 ppm).

68,27%

95,45%

99,73%

NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ

Transformace náhodné veličiny , rozdělené N(, 2),

odstraňuje závislost na parametrech a 2 . Nová náhodná veličina má normální rozdělení N(0,1) se střední hodnotou 0 a rozptylem 1 a nabývá hodnot

Potom hustota pravděpodobnosti :

a distribuční funkce :

Střední hodnota : E ( ) = a rozptyl : D ( ) = 1 .

x

u

2u

2

1

e2

1u

dye2

1u

uy

2

1 2

Tabulka kvantilů rozdělení N(0, 1)

Hodnoty kvantilů u náhodné veličiny , rozdělené N(0, 1), jsou hodnoty u vyhovující rovnici

jsou tabelovány pro hodnoty 0,001 0,999.

Jelikož platí u1- = - u , jsou uvedeny pouze hodnoty kvantilů pro 0,5 1 .

Pro výpočet kvantilů x náhodné veličiny rozdělené N( , 2 ) se použije vztah

x = + u .

u

PŘÍKLAD :

Pro = 0,925 je u = u0,925 = 1,44 ;

pro = 0,075 je u = u0,075 = u1–0,925 = –u0,925 = –1,44 .

Uvažujme náhodnou veličinu rozdělenou N(, 2) = N(3; 0,25).

Potom vzhledem k tomu že = 0,5 je

pro = 0,925 je x = x0,925 = + u = 3 + 1,44 0,5 = 3,72,

pro = 0,075 je x = x0,075 = + u = 3 + (-1,44) 0,5 = 2,28.

Pod hodnotou 3,72 bude ležet v průměru 92,5% všech pozorování,

resp. pod hodnotou 2,28 bude ležet v průměru 7,5% všech pozorování.

POZNÁMKA:

V některých aplikacích, zejména v SPC, se označují kvantily normovaného normálního rozdělení up

symbolem z .

Jsou tabelovány podíly pz pro z což jsou podíly nad

hodnotou + z nebo pod hodnotou – z pro normální rozdělení N(, 2). Hodnota z představuje vzdálenost od střední hodnoty v jednotkách směrodatné odchylky.

Příklad: Pro z = 2, je pz = 0,0228 . Nad hodnotou + 2 , stejně jako pod hodnotou –2 leží v průměru podíl 0,0228 jednotek .

Hustota pravděpodobnosti (u) rozdělení N(0, 1)

Hustoty pravděpodobnosti

normovaného normálního rozdělení N(0,1) jsou tabelovány pro 0 u 3,99 , pro – 3,99 u 0 je

(–u) = (u) .

Pro normální rozdělení N(, 2) je hustota pravděpodobnosti

rovna

2u

2

1

e2

1u

2

x

2

1

e2

1xf

x1

u1

xf

Zakreslení křivky hustoty pravděpodobnosti rozdělení N(, 2) do histogramu

Do histogramu s šířkou třídních intervalů h a celkovým počtem

pozorování n ( n = , nj ; j = 1, 2, ... , k ; jsou třídní četnosti)

zakreslíme křivku normálního rozdělení relativních četností:

případně křivku rozdělení absolutních třídních četností:

k

1jjn

x1

hu1

hxf re,h

x1

hnu1

hn)x(fnxf re,hab,h

Bylo proměřeno n = 200 průměrů čepů z výrobního procesu.

Byl vypočten výběrový průměr = 23,416 mm (odhad )

a směrodatná odchylka s = 0,108 mm (odhad ) .

Údaje byly seskupeny do tříd šířky h = 0,05 mm a sestrojen histogram .

Do histogramu zakreslíme křivku hustoty pravděpodobnosti odpovídající normálnímu rozdělení N(23,416; 0,1082)

Pro bod x = 23,34 mm je

u = ( x - ) / = (23,340 - 23,416) / 0,108 = -0,7037

a (u) = (-0,70) = 0,3123.

Potom

fh,re(x) = h (u) / = f0,05;re(23,34) = 0,05 * 0,3123 / 0,108 = 0,1446

a fh,ab(x) = n fh,re(x) = f0,05,ab(23,34) = 200 * 0,1446 = 28,92.

PŘÍKLAD :

x

0

5

10

15

20

25

30

35

40

45

23,14 23,19 23,24 23,29 23,34 23,39 23,44 23,49 23,54 23,59 23,64

0,000

0,025

0,050

0,075

0,100

0,125

0,150

0,175

0,200

0,225

0,144628,92

Zakreslení křivky normálního rozdělení N(23,416; 0,1082) do histogramu z n = 200 pozorování seskupených do 12 tříd šířky h = 0,05.

Bodové odhady parametrů a Využití normálního rozdělení v praxi předpokládá znalost:

– parametru polohy a – parametru rozptýlení (variability) .

Výstupy z experimentu mohou mít různé formy :

1) Jediný náhodný výběr rozsahu n jednotek : x1, x2, x3, ..., xn .

a) výběrový průměr ;

b) výběrový medián

Me = x(k) , kde k = (n+1)/2 pro n liché a

Me = (x(k) + x(k+1))/2 , kde k = n/2 pro n

sudé ;

c) výběrový rozptyl ;

d) výběrová směrodatná odchylka ;

e) výběrové rozpětí R = xmax - xmin = x(n) - x(1).

n

1iix

n

1x

2n

1ii

2 xx1n

1s

2ss

Odhady :

resp. Me ;

2 s2 ;

s resp. R / d2 .

Konstanty d2 a C4 závislé na rozsahu náhodného výběru n

jsou tabelovány (tabulka č. 2. v ČSN ISO 8258).

x

2) k podskupin stejného rozsahu po n jednotkách ( n1 = n2 = ... = nj = ... = nk = n ) .

podskupinaj

i = 1 i = 2 – i = n výběrovýprůměr

výběrovýmedián

výběrovýrozptyl

výběrovásm. od.

výběrovérozpětí

1 x11 x12 – x1n x1 Me1 s12 s1 R1

2 x21 x22 – x2n x2 Me2 s22 s2 R2

– – – – – – – – – –

k xk1 xk2 – xkn xk Mek sk2 sk Rk

a) celkový výběrový průměr: ;

b) průměrný výběrový medián: ;

k

1j

jxk

1x

k

1jjMe

k

1Me

c) průměrný výběrový rozptyl: ;

d) průměrná výběrová směrodatná odchylka: ;

e) průměrné výběrové rozpětí: .

k

1j

2j

2 sk

1s

k

1jjs

k

1s

k

1jjR

k

1R

Odhady:

resp. ;

2 ;

resp. resp.

1) Konstanty C4 a d2 závislé na rozsahu podskupiny n viz tabulka č. 2. v ČSN ISO 8258.

x Me

2s

2s 4C/s 2d/R

3) k podskupin různého rozsahu nj jednotek (j = 1, 2, …, k)

Celkový počet pozorování je

a) celkový výběrový průměr: ;

b) průměrný výběrový medián: ;

k

1j

jj xnn

1x

k

1jjj Men

n

1Me

podsk.j

i=1i=2–i=nj výběrovýprůměr

výběrovýmedián

výběrovýrozptyl

výběrovásm. od.

výběrovérozpětí

1x11x12–x1n1 x1 Me1 s12 s1 R1

2x21x22–x2n2 x2 Me2 s22 s2 R2

– ––– – – – – – –

k xk1xk2–xknk xk Mek sk2 sk Rk

k

1jjnn

c) průměrný výběrový rozptyl: ;

d) průměrná výběrová směrodatná odchylka: ;

e) průměrné výběrové rozpětí: .

k

1j

2jj

2 s)1n(kn

1s

k

1jjj s)1n(

kn

1s

k

1jjj Rn

n

1R

Odhady:

resp. ;

2 ;

resp. resp.

1) Konstanty C4 a d2 závislé na rozsahu podskupiny n viz tabulka č. 2. v ČSN ISO 8258.

x Me

2s

2s 4C/s 2d/R

Poznámky:

1) Hodnoty C4 a d2 v závislosti na rozsahu výběru jsou

uvedeny v tab. 2 v ČSN ISO 8258.

2) V případě, že podskupiny jsou různého rozsahu

( n1 n2 , ... , nk ) , je celkový počet pozorování

a pak se musí vypočítat vážené hodnoty těchto

koeficientů:

k

1jjnn

k

1j2j2

k

1jj4j4 .)n(dn

n

1d.resp)n(Cn

n

1C

PŘÍKLAD Uvažujme k = 6 podskupin stejného rozsahu n = 5 . Výsledky jsou sestaveny do tabulky, ve které jsou vypočteny průměry podskupin a výběrové směrodatné odchylky sj .

podskupina j

1 2 3 4 5 xj sj

1 1,21,51,41,31,71,42 0,19

2 1,51,81,81,71,61,68 0,13

3 2,12,42,32,02,32,22 0,16

4 1,41,21,31,41,11,28 0,13

5 1,42,21,21,72,21,74 0,46

6 2,12,42,92,62,52,50 0,29

Výpočty:

celkový výběrový průměr : = 1,807 ;

průměrný výběrový rozptyl : = 0,0652 ;

průměrná směrodatná odchylka: = = 0,255 .

Odhady : 1,807 a (0,0652) = 0,255.

x2s

s 2s

POZNÁMKY :

Při analýze výrobního procesu se setkáváme s dalšími charakteristikami:

1) Celkové charakteristiky :

a) celkový výběrový průměr = 1,807

(charakterizuje polohu těžiště souboru vzniklého spojením všech

podskupin za celé sledované období a tedy těžiště procesu za toto

období; je vždy roven průměru výběrových průměrů podskupin ) ;

b) celková směrodatná odchylka stot = 0,493

(charakterizuje variabilitu v souboru vzniklém spojením všech podskupin

za celé sledované období a tedy celkovou variabilitu procesu za toto

období; je obvykle větší než průměrná směrodatná odchylka podskupin,

protože zahrnuje vedle variability uvnitř podskupin i variabilitu mezi

podskupinami) ;

c) průměrná výběrová odchylka = 0,255

(charakterizuje průměrnou variabilitu uvnitř podskupin).

totx

x

s

2) Charakteristiky rozdělení výběrových průměrů :

a) průměr výběrových průměrů = 1,807 ;

b) směrodatná odchylka výběrových průměrů =

0,469

(směrodatná odchylka výběrových průměrů charakterizuje variabilitu

mezi výběrovými průměry podskupin a tedy v podstatě i variabilitu

mezi podskupinami).

x

xs

3) Porovnání odhadů směrodatné odchylky procesu :

a) = 0,255 ;

b) = 0,242 ;

c) = 0,236 .

2s

)n(C/s 4

)n(d/R 2

n C4(n) d2(n)

2 0,7979 1,1280

3 0,8862 1,6930

4 0,9213 2,0590

5 0,9400 2,3260

6 0,9515 2,5340

7 0,9594 2,7040

8 0,9650 2,8470

9 0,9693 2,970010 0,9727 3,0780

ZÁKLADNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÝCH NÁHODNÝCH VELIČIN

Documents

Transcript of ZÁKLADNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÝCH NÁHODNÝCH VELIČIN