PDF995, Job 3 - geocities.ws filePreliminarno poroilo Statistika in verjetnost 4 % & Diskretna...
Transcript of PDF995, Job 3 - geocities.ws filePreliminarno poroilo Statistika in verjetnost 4 % & Diskretna...
��������������� ���������������������������� ���������������������������� ���������������������������� �����������������
� ��������� ������� ��������� ������� ��������� ������� ��������� ����������
�
�
�
������������ ������� ���
��������������������������
Formule, ki smo jih spoznali na vajah
� MANCA JESENKO
�����
FREKVEN�NE PORAZDELITVE �
NUMERI�NE MERE !
Ranžirne vrste .........................................................................................................5
Rang.................................................................................................................................................. 5
Kvantilni rang .................................................................................................................................. 5
Kvantili ............................................................................................................................................. 5
Kvartili .............................................................................................................................................. 5
Mere srednje vrednosti ...........................................................................................5
Aritmeti�na sredina – to�ka ravnotežja ........................................................................................ 5
Mediana ............................................................................................................................................ 5
Modus............................................................................................................................................... 5
Harmoni�na sredina........................................................................................................................ 6
Geometri�na sredina sredina......................................................................................................... 6
Mere razpršenosti podatkov...................................................................................6
Variacijski razmik ............................................................................................................................ 6
Varianca ........................................................................................................................................... 6
Standardni odklon........................................................................................................................... 6
Koeficient variacije.......................................................................................................................... 6
Opisovanje normalne frekven�ne porazdelitve ....................................................7
Mere oblik frekven�nih porazdelitev .....................................................................7
Asimetri�nost .................................................................................................................................. 7
Sploš�enost ..................................................................................................................................... 7
DISKRETNE VERJETNOSTNE PORAZDELITVE "
Porazdelitveni zakon diskretne slu�ajne spremenljivke – verjetnostna porazdelitev ............. 8
POSEBNE DISKRETNE SLU�AJNE SPREMENLJIVKE "
Binomska slu�ajna spremenljivka.........................................................................8
Poissonova porazdelitev ........................................................................................8
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 3
Negativna binomska porazdelitev .........................................................................8
ZVEZNE VERJETNOSTNE PORAZDELITVE #
Normalna porazdelitev............................................................................................9
Standardizirana normalna porazdelitev ................................................................9
Ploš�ina pod krivuljo standardizirane normalne porazdelitve................................................. 10
Aproksimacija binomske v normalno..................................................................11
OCENJEVANJE PARAMETROV POPULACIJE $$
To�kasta ocena .....................................................................................................11
Intervalska ocena ..................................................................................................11
Velikost vzorca ......................................................................................................11
TESTIRANJE HIPOTEZ O ARITMETI�NI SREDINI $�
REGRESIJA IN KORELACIJA $�
Enostavna linearna regresija in korelacija ................................................................................. 13
Koeficient korelacije ranžirnih vrst ............................................................................................. 13
�ASOVNE VRSTE $�
Metoda drse�ih sredin ..........................................................................................14
Metoda eksponentnega glajenja ..........................................................................14
Model �asovne vrste.............................................................................................14
KOEFICIENTI DINAMIKE �ASOVNIH VRST $�
Tempo rasti............................................................................................................14
Koeficient dinamike ..............................................................................................14
Verižni indeks ........................................................................................................14
Bazni indeks ..........................................................................................................14
�
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 4
������ % ��&����������Diskretna frekven�na porazdelitev Med zbranimi podatki o diskretni spremenljivki X (zavzema samo cele vrednosti), preštejemo kolikokrat se pojavi posamezna vrednost spremenljivke X (npr. med ocenami 100 študentov, preštejemo koliko študentov je pisalo oceno 1, oceno 2, ..., oceno 10). Številu posamezneih vrednosti spremenljivke X pravimo frekvenca vrednosti spremenljivke (npr. �e med 100 študenti preštejemo vse tiste, ki so pisali 6 in ugotovimo, da je takih študentov 40), potem je frekvenca šestice pri spremenljivki ocena enaka 40.
�����������
�� �
������� �
���
�������
������� �
���
�� �� �����
������� �
�� �
�������
�� �� �����
������� �
�� �
��� ��� ��� ��� ���
��� ��� ��� ��� ���
� � � � �
�� �� �� �� ��
� � � � �
��� ��� ��� ��� ���
���� Nf =� � 1=� p � ���� ����
Zvezna frekven�na porazdelitev Pri zvezni spremenljivki X, vrednosti spremenljivke lahko ležijo kjerkoli na dolo�enem intervalu. Zato moramo zvezno spremenljivki najprej razdeliti na nekaj manjših podintervalov – razredov. Frekvence spremenljivke X potem dobimo tako, da preštejemo koliko enot pade v posamezen podinterval.
Nf
p = ;
iii fFFfF +== −111 ;
NF
H =
možnost razdelitve zvezne spremenljivke v podintervale je s pomo�jo Sturgessovega pravila �
� Nlog3,31 n razredov število += , pri �emer je N število enot, ki jih prou�ujemo
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 5
'�( ���% ��( ���� Ranžirne vrste Rang
negrupirani podatki
−+
−+
−
−
−−
=−−
RRxx
RRxx
x
� −+
−− −
−+=
xxxx
RRx
grupirani podatki
k
kk
k
iix x
rxffR
∆−
+= −−
=� 1
1
1
Kvantilni rang
NR
P xx
5,0−= � kvantilni rang se ra�una po istem postopku za negrupirane in grupirane podatke
Kvantili Dan je kvantilni rang P (0<=P<=1)
negrupirani podatki
PnP xx )*1( +=
grupirani podatki
kk
k
ii
kP xf
fNPrx ∆
−+=
�−
=−
1
11
Kvartili So vrednosti, ki razdelijo prou�evane podatke popualcije ali vzorca na 4 enake dela � Q1, Q2, Q3 … torej tem kvartilom pripadajo kvantilni rangi PQ1=0.25, PQ2=0.50, PQ3=0.75,
Mere srednje vrednosti Aritmeti�na sredina – to�ka ravnotežja
negrupirani podatki
n
xx
n
ii�
=
grupirani podatki
n
fxx
K
iSi�
=
Mediana
negrupirani podatki
21+= NxMe
grupirani podatki
kk
k
i
k xf
fN
rMe ∆−
+=�
−
−
1
11
2;
Modus
negrupirani podatki � najpogostejša vrednost, ki se pojavi v
podatkih
grupirani podatki
kkkkk
kkk x
ffffff
rMo ∆−+−
−+=
+−
−− )()( 11
11
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 6
Harmoni�na sredina
negrupirani podatki
�=
= N
i i
H
x
Nx
1
1
grupirani podatki
�
�
=
== K
i Si
i
K
ii
H
xf
fx
1
1
Geometri�na sredina sredina
negrupirani podatki N
NG xxxx ⋅⋅= ...21 grupirani podatki
N fSk
fS
fSG
Kxxxx ⋅⋅= ...2121
Mere razpršenosti podatkov Variacijski razmik
minmax xxR −=
Varianca Najpogostejša mera razpršenosti podatkov … ra�una povpre�ni odklon kvadriranih vrednosti od aritmeti�ne sredine.
negrupirani podatki
N
Nx
N
xN
ii
N
ii ��
==
−=
−= 1
22
1
2
2
)( µµσ (populacija)
11
)(1
22
1
2
2
−
−=
−
−=
��==
n
xnx
n
xxs
n
ii
n
ii
(vzorec)
grupirani podatki
N
Nfx
N
xfK
iSi
K
iSi ��
==
−=
−= 1
22
1
2
2
)( µµσ (populacija)
11
)(1
22
1
2
2
−
−=
−
−=
��==
n
xnfx
n
xxfs
K
ii
K
ii
(vzorec)
Standardni odklon
2σσ = (populacija) 2ss = (vzorec)
Koeficient variacije
xs
kv =
N ali n=število podatkov, ki jih prou�ujemo (�e delamo na podlagi vzor�nih podatkov, potem število podatkov ozna�imo z n) K=število razredov v frekven�ni porazdelitvi k=razred na katerega se nanaša izra�un fi=frekvenca i-tega razreda; fk=frekvenca k-tega razreda
xSi=sredina razreda rk-1=spodnja meja k-tega razreda
∆xk=širina k-tega razreda
indeksi k-1 ali k+1 pomenijo vrednosti pred (k-1) oz. za (k+1) k-tim razredom
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 7
Opisovanje normalne frekven�ne porazdelitve ��ima en sam vrh, in sicer nad aritmeti�no sredino=mediana=modus ��glede na srednjo vrednost je popolnoma simetri�na ��repi normalne porazdelitve grejo levo in desno od centra se asimptoti�no bližajo vododravni osi
aritmeti�na sredinamedianamodus
�)�!
�)$
�)�
�)�
�)�
�)$
�)�!
σ1− σ1+
σ2− σ2+
σ3− σ3+
=cca. 68%
=cca. 95%
=cca. 99% Mere oblik frekven�nih porazdelitev Asimetri�nost negrupirani podatki
3
1
2
1
3
1
)(1
)(1
��
���
� −
−=
�
�
=
=
N
ii
N
ii
xxN
xxNg
grupirani podatki
3
1
2
1
3
1
)(1
)(1
��
���
� −
−=
�
�
=
=
K
iii
K
iSii
xxfN
xxfNg
Opomba: spodnji del formule predstavlja varianco!
Sploš�enost negrupirani podatki
2
1
2
1
4
2
)(1
)(1
��
���
� −
−=
�
�
=
=
N
ii
N
ii
xxN
xxNg
grupirani podatki
2
1
2
1
4
2
)(1
)(1
��
���
� −
−=
�
�
=
=
K
iSii
K
iSii
xxfN
xxfNg
Opomba: spodnji del formule predstavlja varianco!
Fisherjev koeficient sploš�enosti: 32 −= gγ
Opomba: za normalno porazdelitev je g2=3!
�e se koeficinta asimetri�nosti in sploš�enosti bistveno razlikujeta od NI�, se frekven�na porazdelitev bistveno razlikuje od normalne!!!
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 8
*������ �������� �� ��&���������� Porazdelitveni zakon diskretne slu�ajne spremenljivke – verjetnostna porazdelitev
ξ x1 x2 … xk … xn ---
P(ξ =x) p1 p2 … pk … pn 11
=�=
n
iip
Porazdelitvena funkcija diskretne slu�ajne spremenljivke
�≤
=xx
ii
pxF )(
Aritmeti�na sredina – matemati�no upanje diskretne slu�ajne spremenljivke
�=
==n
iii pxM
1
)(ξµ
Varianca diskretne slu�ajne spremenljivke
( )( ) �=
=−==−==n
iii pxMMMVMMV
1
2222222 )( je�emer pri );()()()( ξξξξσξξξσ
Standardni odklon diskretne slu�ajne spremenljivke
)(ξσ V=
+��� ��������� �����%�� ���&��( � ������� Binomska slu�ajna spremenljivka
Porazdelitveni zakon
knk qpk
nkP −
���
����
�== )(ξ
Matemati�no upanje
M( )ξ =np
Varianca in standardni odklon
npq ;)( === VnpqV σξ
Poissonova porazdelitev Porazdelitveni zakon
!)(
ke
kPk λλξ
−
==
rekurzivna formula:
kkPkP
λξξ )1()( −===
Matemati�no upanje
λξ =)(M
Varianca in standardni odklon
λσλ === VV ;
Negativna binomska porazdelitev Porazdelitveni zakon
rkrrkr qpr
kqp
rk
kkP −−
���
����
�
−−
=���
����
�
−−
==111
)(ξ
Matemati�no upanje
pr
M =)(ξ
Varianca in standardni odklon
22 )( ;)(prq
Vprq
V === ξσξ
Preliminarno poro�ilo
Stat is t ika in ver je tnos t � 9
,�� �������� �� ��&����������Normalna porazdelitev
Zna�ilnosti normalne porazdelitve:
– en vrh (M=Me=Mo) – popolnoma simetri�na – repi krivulje se ne dotikajo osi x
gostota verjetnosti ���� ��
���
� −−
= σµ
πσ
x
exf 21
21
)(
Standardizirana normalna porazdelitev
σµ−= x
z
10
M(x)= 4 M(x)= 12 M(x)= 20
S(x)= 1
S(x)= 2
S(x)= 1
0 1 2 3-1-2-3
Preliminarno poro�ilo
Stat i s t ika in ver je tnos t � 11
Aproksimacija binomske v normalno
σµ−= x
z pri �emer je: np=µ
npq=σ
-�� ���� ���&���( �����&&��������To�kasta ocena Izra�unamo jo po formuli za parameter ... npr. za aritmeti�no sredino ...
Intervalska ocena
ασ
µ −=<−<−=<<− 1)()( knx
kPkzkP .
Na podlagi tega pa lahko dolo�imo interval zaupanja za povpre�je populacije:
nkx
nkx
σµσ +≤≤−
Velikost vzorca
Zahteva � dx ≤− µ
Potrebna velikost vzorca � 2
��
���
�≥d
kn
σ
Preliminarno poro�ilo
Stat i s t ika in ver je tnos t � 12
.������ ���/�&��������( ���% ������� ��Kaj je to … preverjanje predpostavk o parametrih populacije 1. Najprej postavimo ni�elno in alternativno hipotezo H0: M=A H1: M ≠ A
2. Na podlagi stopnje zaupanja α−1 , oziroma stopnje tveganja (tudi napake 1. vrste) α dolo�imo
interval sprejemanja hipoteze � -k ≤−≤ nAx
σk
64,110,090,01 ===− kαα
96,105,095,01 ===− kαα
58,201,099,01 ===− kαα
3. S testom hipoteze z za preverjanje aritmeti�ne sredine na podlagi vzor�nih podatkov izra�unamo vrednost testa hipoteze:
nAx
zσ−=
4. Pogledamo ali izra�unan test hipoteze z pade znotraj intervala sprejemanja hipoteze (-k,+k) � s
stopnjo tveganja α sprejememo sklep o sprejetju alternativne hipoteze (“ni�elno hipotezo
sprejememo”), ali pade izven intervala sprejemanja hipoteze (-k,+k) � ni�elno hipotezo zavrnemo
pri stopnji tveganja α .
Preliminarno poro�ilo
Stat i s t ika in ver je tnos t � 13
0���������� �����������Enostavna linearna regresija in korelacija
X Y X2 Y2 XY x1 y1 x1
2 y12 x1y1
x2 y2 x22 y2
2 x2y2 ... ... ... ... ... xn yn xn
2 yn2 xnyn
� =
n
i ix1 � =
n
i iy1 � =
n
i ix1
2 � =
n
i iy1
2 � =
n
i ii yx1
Najprej izra�unamo delne vsote:
( ) 2
1
2
1
2 xnxxxSn
ii
n
iixx −=−= ��
==
( ) 2
1
2
1
2 ynyyySn
ii
n
iiyy −=−= ��
==
( )( ) yxnyxyyxxSn
iii
n
iiixy −=−−= ��
== 11
Na podlagi tako izra�unanih delnih vsot najprej izra�unamo oceno parametra β :
xx
xy
S
Sb = , in nato še oceno parametra α : xbay += � xbya −=
Skupna ali za�etna varianca: ( )11
1
1
22
−=−
−= �
= n
Syy
ns yy
n
iiY
Nepojasnjena varianca: ( ) ( )xyyy
n
iiie bSS
nbxay
ns −
−=+−
−= �
= 21
)(2
1
1
22
Pojasnjena varianca: 222eyxy sss −=
Determinacijski koeficient: 2
2
2
22
1y
e
y
ey
ss
s
ssD −=
−=
Korelacijski koeficient: xxyy
xy
SS
Sr = ... velja tudi: D ≈ r2
Koeficient korelacije ranžirnih vrst ... ali Spearmanov koeficient korelacije
( )� =−
−−= n
i iiS vwnn
r1
22 )1(6
1
Preliminarno poro�ilo
Stat i s t ika in ver je tnos t � 14
1��� ��������Metoda drse�ih sredin perioda drsenja: m � nm ≤≤1 (n je število podatkov, ki jih prou�ujemo)
Za�etno napoved delamo za obdobje m+1:
myyy
y mm
+++=+
...211
Nadaljnje napovedi pa lahko ra�unamo po formuli:
myy
yy mtttt
−+
−+= ''
1 ; �e je m velik potem predpostavljamo veliko slu�ajnih vplivov
Metoda eksponentnega glajenja faktor glajenja: g � 10 ≤≤ g
Za za�etno napoved vzamemo kar:
1'1 yy =
Nadaljnje napovedi pa ra�unamo po formuli:
)( '''1 tttt yygyy −+=+ ; �e je g majhen potem predpostavljamo veliko slu�ajnih vplivov
Model �asovne vrste Najprej obdobje opazovanja spremenimo v tehni�ni �as � pri katerem je njegova vsota enaka 0 …
T Y X Y2 YX X2
T1 y1 x1 y12 y1x1 x1
2
T2 y2 x2 y22 y2x2 x2
2
… … … … … …
Tn yn xn yn2 ynxn xn
2
�
=
n
iiy
1
01
=�=
n
iix �
=
n
iiy
1
2 �=
n
iii yx
1
�=
n
iix
1
2
n
ya
n
ii�
== 1 ;
�
�
=
== n
ii
n
iii
x
yxb
1
2
1 � T = a + bx
��2���� ����� �( ����%��� �/������Tempo rasti
1001
1 ⋅−
=−
−
k
kkk y
yyT
Koeficient dinamike
1−
=k
kk y
yK
Verižni indeks
1001
⋅=−k
kk y
yV
Bazni indeks
1000
0, ⋅=yy
I kk