Valószínőségszámítás - zempleni/2VALSZ_A11.pdf · Elfajult eloszlásra (X=c1...
Transcript of Valószínőségszámítás - zempleni/2VALSZ_A11.pdf · Elfajult eloszlásra (X=c1...
1
Valószínőségszámítás
11. elıadás2011.12.01.
Karakterisztikus függvényDef.: X (valós) valószínőségi változó karakterisztikus függvénye: ϕX(t):=E(eitX)=E(costX)+iE(sintX)
Példák:� Elfajult eloszlásra (X=c 1 valószínőséggel):
ϕX(t)=E(eitX)=E(costc)+iE(sintc)= costc+isintc= eitc.� Indikátor változóra:
ϕX(t)=E(eitX)=(1-p)+peit.� Binomiális eloszlásra:
ϕX(t)=E(eitX)=((1-p)+peit)n.� Poisson eloszlásra:
)1(
0 !)( −
∞
=
−
==∑ite
k
kitkitX e
k
eeeE λ
λλ
2
További tulajdonságok� Ha Y=aX+b, akkor ϕY(t)= eibtϕX(at)� Bizonyítás: ϕY(t)= E(ei(aX+b)t)= eibt E(eiaXt)= eibtϕX(at).� Kiszámítása az abszolút folytonos esetre:
� Példa. Ha X egyenletes eloszlású a [-1,1] intervallumon, akkor
� Általában is: ϕX valós, ha X eloszlása szimmetrikus a 0-ra.
∫ ∫ ∫∞
∞−
∞
∞−
∞
∞−
+== dxxftxidxxftxdxxfet itx
X )()sin()()cos()()(ϕ
t
t
t
txdx
txdxxfet itx
X
sin
2
sin
2
)cos()()(
1
1
1
1
=
===−
∞
∞− −∫ ∫ϕ
A standard normális eloszláskarakterisztikus függvénye
� Áll.: a standard normális eloszlás karakterisztikus függvénye:
� Ehhez: eleget tesz a ψ’(t)=-t ψ(t) differenciálegyenletnek. (Ez lényegében elég is: (log ψ(t))’=-t, amibıl log ψ(t)=-t2/2+c, de log(ψ(0))=0 miatt c=0.)
parciális integrálással.
2
2
)(t
et−
=ϕ
∫∫∞
∞−
−∞
∞−
−−== dxetxxtdxetxt
xx
22
22
2
1)sin()(' ;
2
1)cos()(
πψ
πψ
)()cos(2
1)sin(
2
1)(' 22
22
ttdxetxtetxtxx
ψππ
ψ −=−
−= ∫
∞
∞−
−∞
∞−
−
3
További tulajdonságok� A karakterisztikus függvény meghatározza az eloszlást (azaz különbözı eloszlásokhoz különbözı karakterisztikus függvény tartozik).
� Taylor sorfejtés: tegyük fel, hogy E(Xn) véges valamilyen n≥1 egész számra. Ekkor t→0 mellett
ahol o(tn) jelentése, hogy tn–nel osztva is 0-hoz tart, ha t→0.
� Bizonyítás ötlete: a tétel feltétele esetén ϕX(t) n-szeregyenletesen folytonosan deriválható és
)()(!
)(...)(
!2
)()(
!11)( 2
2nn
n
X toXEn
itXE
itXE
itt +++++=ϕ
∫∞
∞−
= dxxfixet litxl
X )()()()(ϕ
További tételek
Azaz ϕX(k)(0)= ikE(Xk) és így a szokásos Taylor-
sorfejtésbıl adódik a tétel.� Ha ϕ karakterisztikus függvény, akkor egyenletesen folytonos.
� Folytonossági tétel. Legyen ϕn karakterisztikus függvények egy sorozata (jelölje Qn a hozzá tartozóeloszlást). Ha ϕn pontonként konvergál egy ϕ-hez, mely a 0-ban folytonos, akkor ϕ is karakterisztikus függvény, és a hozzá tartozó eloszlás éppen a eloszlások Q gyenge határértéke.
4
Centrális határeloszlás tétel� Legyenek X1 , X2 ,…, Xn ,... független, azonos eloszlású
valószínőségi változók. Tegyük fel, hogy σ2=D2(X) véges (m:=E(Xi)). Tekintsük a standardizált összegüket:
Ekkor Zn gyengén konvergál a standard normális eloszláshoz, azaz
ahol Φ a standard normális eloszlás eloszlásfüggvénye.
σnnmXX
Z nn
−++=
...: 1
)(...1 zzn
nmXXP n Φ→
<
−++
σ
Bizonyítás vázlata� Elegendı a Zn karakterisztikus függvényére belátni,
hogy ϕn(t)→exp{-t2/2}.
� Ha ψ(t) jelöli az Xn-m karakterisztikus függvényét, akkor X1+X2+…+Xn-nm karakterisztikus függvénye ψn(t). Ebbıl
� A maradéktagos Taylor formula miatt
n
nn
tt
= )()(
σψϕ
)(2
1)(!2
)(
!1
)(1)( 22
22
222 totto
mXEti
mXEitt +−=+
−+
−+=
σψ
5
Bizonyítás befejezése
Megjegyzés. A tételt tulajdonképpen már megfigyeltük a szimulációknál.Példák:•egyenletes eloszlás�gamma eloszlás
2
22222
)1(1
21
21)()(
tnnn
n eonn
t
n
to
n
t
n
tt
−→
+−=
+
−=
=σσ
σσ
ψϕ
Kérdések� Milyen konvergenciát állítanak az úgynevezett erıs tételek?
� Legyen X standard normális eloszlású. Milyen becslés adódik a Csebisev egyenlıtlenségbıl a P(|X|>3) valószínőségre?
� Legyen EX=10. Mit mondhatunk a Markovegyenlıtlenség alapján a P(X>1000) valószínőségrıl?
6
A nem azonos eloszlású eset� Ekkor – a nagy számok törvényénél már látott okok miatt –
erısebb feltételek kellenek.� A legegyszerőbb eset: ha X1 , X2 ,…, Xn ,... független,
egyenletesen korlátos valószínőségi változók (ekkor σi2=D2(Xi) véges, mi:=E(Xi)), akkor a standardizált összegük:
Ekkor Zn gyengén konvergál a standard normális eloszláshoz, azaz
ahol Φ a standard normális eloszlás eloszlásfüggvénye.
22
1
11
...
)...(...:
n
nnn
mmXXZ
σσ ++
++−++=
( ) )(zzZP n Φ→<
Általánosítások
� Ha nem korlátosak a tagok, további feltételekre (pl. magasabb momentumok létezése, hasonló nagyságrendő összeadandók) van szükség.
� Gyenge, a Bernstein tételben látott összefüggıség esetére is általánosítható a tétel.
7
Konvergenciasebesség� Ha X1 , X2 ,…, Xn ,... független, azonos eloszlású valószínőségi változók, t.f.h. m=0, σ=1, akkor
(Berry-Esséen tétel).� Gyakorlatban nagyon függ az eloszlás alakjától. Például az egyenletes eloszlásra n=12 elég jó közelítést ad, de az exponenciális eloszlásnál n=50 szükséges.
n
XEczz
n
nmXXP n
z
3
11 ||)(
...sup ≤Φ−
<
−++
σ
Centrális határeloszlás-tétel: független, azonos, egyenletes eloszlások standardizált összege (n=512,128,32,8)
Itt és a következı olda-lakon az adott n számúvéletlen számot generál-tuk, standardizáltuk az összegüket, és ezt 10000-szor megismételtük mindenesetben. Ezek után aztvizsgáltuk, hogy a kapott 10000 véletlen szám mennyirevan közel a standard nor-mális eloszláshoz.
megfigyelések száma:25
x
Gyakoriság
-4 -2 0 2 4
0500
1000
1500
2000
megfigyelések száma:100
x
Gyakoriság
-4 -2 0 2 4
0500
1000
1500
megfigyelések száma:400
x
Gyakoriság
-4 -2 0 2 4
0500
1000
1500
2000
megfigyelések száma:1600
x
Gyakoriság
-4 -2 0 2 4
0500
1000
1500
2000
8
Eloszlás illeszkedésének vizsgálata: Q-Q plot
A megfigyelt és az illesz-tett eloszlás kétdimenziósábrázolása.Eloszlásfüggvényq-kvantilise: az az érték, amelynél q valószínőség-gel kapunk kisebbet: G-1(q)Spec.: q=1/2: medián
=
+
−nkX
n
kG
n
k ,...,2,1:,1
)(1 -2 -1 0 1 2
-2-1
01
Q-Q plot, normális eloszlású mintára
modell
minta
Eloszlás illeszkedésének vizsgálata: P-P plot
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Probability Plot
Model
Empirical
A megfigyelt és az illesz-
tett eloszlás kétdimenziós
ábrázolása
=
+
nkXGn
k n
k ,...,2,1:)(,1
)(
9
Centrális határeloszlás-tétel: független, azonos, egyenletes eloszlások standardizált összege (n=5,20,80,200)
-4 -2 0 2 4
-3-2
-10
12
3
Q-Q plot, normalitásvizsgálatra
n= 5modell
minta
-4 -2 0 2 4
-20
24
Q-Q plot, normalitásvizsgálatra
n= 20modell
minta
-4 -2 0 2 4
-3-2
-10
12
3
Q-Q plot, normalitásvizsgálatra
n= 80modell
minta
-4 -2 0 2 4
-20
24
Q-Q plot, normalitásvizsgálatra
n= 320modell
minta
Már 5 megfigyelésre sem rossz az illeszkedés
Centrális határeloszlás-tétel: független, azonos, exponenciális eloszlások standardizált összege (n=5,20,80,200)
-4 -2 0 2 4
-20
24
Q-Q plot, normalitásvizsgálatra
n= 5modell
minta
-4 -2 0 2 4
-3-2
-10
12
34
Q-Q plot, normalitásvizsgálatra
n= 20modell
minta
-4 -2 0 2 4
-20
24
Q-Q plot, normalitásvizsgálatra
n= 80modell
minta
-4 -2 0 2 4
-20
24
Q-Q plot, normalitásvizsgálatra
n= 320modell
minta
10
Centrális határeloszlás-tétel: független, azonos, Pareto (k=3) eloszlások standardizált összege (n=80,1280,20000)
-3 -2 -1 0 1 2 3
-20
24
68
10
12
Q-Q plot, normalitásvizsgálatra
n= 80modell
minta
-3 -2 -1 0 1 2 3
-20
24
6
Q-Q plot, normalitásvizsgálatra
n= 1280modell
minta
-3 -2 -1 0 1 2 3
-3-2
-10
12
3
Q-Q plot, normalitásvizsgálatra
n= 20000modell
minta
Itt nagyon lassú akonvergencia
Centrális határeloszlás-tétel: független, azonos, Pareto (k=2) eloszlások standardizált összege (n=80,1280,20000,100000)
-3 -2 -1 0 1 2 3
-50
510
15
Q-Q plot, normalitásvizsgálatra
n= 80modell
minta
-3 -2 -1 0 1 2 3
010
20
30
40
Q-Q plot, normalitásvizsgálatra
n= 1280modell
minta
-3 -2 -1 0 1 2 3
-10
010
20
30
40
Q-Q plot, normalitásvizsgálatra
n= 20000modell
minta
-3 -2 -1 0 1 2 3
-10
010
20
30
Q-Q plot, normalitásvizsgálatra
n= 1e+05modell
minta
Itt nincs konvergencia
11
Stabilis eloszlások� A normális eloszlás kitüntetett szerepe azon alapult, hogy
teljesítette az ún. stabilitást: ha X,Y független, F eloszlásfüggvényőek, akkor tetszıleges a,b esetén megadhatók α β számok, hogy aX+bY eloszlásfüggvénye F(αz+β). (Azaz aX+bY ugyanabba az eloszláscsaládba tartozik, mint az összeadandók.)
� Belátható, hogy független, azonos eloszlású változók összegének normálás utáni határeloszlása csak stabilis lehet. Ugyanakkor minden ilyen stabilis eloszlás elı is áll határeloszlásként.
� A centrális határeloszlás tétel következménye, hogy nincs más véges szórású stabilis eloszlás. Ugyanakkor nem véges szórásúvan: pl. a Cauchy eloszlás, melynek sőrőségfüggvénye f(x)=1/π(1+x2 )
A centrális határeloszlás tétel lokális változata� Legyenek X1 , X2 ,…, Xn ,... független, azonos eloszlású valószínőségi változók. Tegyük fel, hogy σ2=D2(X) véges (m:=E(Xi)) valamint, hogy abszolút folytonosak, szakaszonként folytonos sőrőségfüggvénnyel. Tekintsük a standardizált összegüket (Zn) és tegyük fel, hogy legalább egy n-re Zn sőrőségfüggvénye korlátos. Ekkor a Zn változó fnsőrőségfüggvénye (mely a tagok abszolút folytonossága miatt létezik) konvergál a standard normális eloszlás sőrőségfüggvényéhez, azaz
2
2
2
1)(
t
n etf−
→π
12
Az indikátorváltozók esete� Tétel (Moivre-Laplace) Legyenek X1 , X2 ,…, Xn ,... független, azonos p paraméterő indikátorváltozók. Ekkor Y=X1+X2+…+Xn binomiális eloszlású (n,p) paraméterrel.
� A közelítés egyenletesen jó olyan k értékekre, melyek legfeljebb (np(1-p)) –vel térnek el np-tıl (azaz a binomiális eloszlás centrális tagjai jól közelíthetıek a megfelelı normális eloszlás sőrőségfüggvényével).
� binomiális eloszlás
)1(2
)( 2
)1(2
1)1()( pnp
npk
knk epnp
ppk
nkYP −
−−
−
−≈−
==
π