PDF995, Job 3 - geocities.ws filePreliminarno poroilo Statistika in verjetnost 4 % & Diskretna...

14
Formule, ki smo jih spoznali na vajah MANCA JESENKO

Transcript of PDF995, Job 3 - geocities.ws filePreliminarno poroilo Statistika in verjetnost 4 % & Diskretna...

��������������� ���������������������������� ���������������������������� ���������������������������� �����������������

� ��������� ������� ��������� ������� ��������� ������� ��������� ����������

������������ ������� ���

��������������������������

Formule, ki smo jih spoznali na vajah

� MANCA JESENKO

�����

FREKVEN�NE PORAZDELITVE �

NUMERI�NE MERE !

Ranžirne vrste .........................................................................................................5

Rang.................................................................................................................................................. 5

Kvantilni rang .................................................................................................................................. 5

Kvantili ............................................................................................................................................. 5

Kvartili .............................................................................................................................................. 5

Mere srednje vrednosti ...........................................................................................5

Aritmeti�na sredina – to�ka ravnotežja ........................................................................................ 5

Mediana ............................................................................................................................................ 5

Modus............................................................................................................................................... 5

Harmoni�na sredina........................................................................................................................ 6

Geometri�na sredina sredina......................................................................................................... 6

Mere razpršenosti podatkov...................................................................................6

Variacijski razmik ............................................................................................................................ 6

Varianca ........................................................................................................................................... 6

Standardni odklon........................................................................................................................... 6

Koeficient variacije.......................................................................................................................... 6

Opisovanje normalne frekven�ne porazdelitve ....................................................7

Mere oblik frekven�nih porazdelitev .....................................................................7

Asimetri�nost .................................................................................................................................. 7

Sploš�enost ..................................................................................................................................... 7

DISKRETNE VERJETNOSTNE PORAZDELITVE "

Porazdelitveni zakon diskretne slu�ajne spremenljivke – verjetnostna porazdelitev ............. 8

POSEBNE DISKRETNE SLU�AJNE SPREMENLJIVKE "

Binomska slu�ajna spremenljivka.........................................................................8

Poissonova porazdelitev ........................................................................................8

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 3

Negativna binomska porazdelitev .........................................................................8

ZVEZNE VERJETNOSTNE PORAZDELITVE #

Normalna porazdelitev............................................................................................9

Standardizirana normalna porazdelitev ................................................................9

Ploš�ina pod krivuljo standardizirane normalne porazdelitve................................................. 10

Aproksimacija binomske v normalno..................................................................11

OCENJEVANJE PARAMETROV POPULACIJE $$

To�kasta ocena .....................................................................................................11

Intervalska ocena ..................................................................................................11

Velikost vzorca ......................................................................................................11

TESTIRANJE HIPOTEZ O ARITMETI�NI SREDINI $�

REGRESIJA IN KORELACIJA $�

Enostavna linearna regresija in korelacija ................................................................................. 13

Koeficient korelacije ranžirnih vrst ............................................................................................. 13

�ASOVNE VRSTE $�

Metoda drse�ih sredin ..........................................................................................14

Metoda eksponentnega glajenja ..........................................................................14

Model �asovne vrste.............................................................................................14

KOEFICIENTI DINAMIKE �ASOVNIH VRST $�

Tempo rasti............................................................................................................14

Koeficient dinamike ..............................................................................................14

Verižni indeks ........................................................................................................14

Bazni indeks ..........................................................................................................14

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 4

������ % ��&����������Diskretna frekven�na porazdelitev Med zbranimi podatki o diskretni spremenljivki X (zavzema samo cele vrednosti), preštejemo kolikokrat se pojavi posamezna vrednost spremenljivke X (npr. med ocenami 100 študentov, preštejemo koliko študentov je pisalo oceno 1, oceno 2, ..., oceno 10). Številu posamezneih vrednosti spremenljivke X pravimo frekvenca vrednosti spremenljivke (npr. �e med 100 študenti preštejemo vse tiste, ki so pisali 6 in ugotovimo, da je takih študentov 40), potem je frekvenca šestice pri spremenljivki ocena enaka 40.

�����������

�� �

������� �

���

�������

������� �

���

�� �� �����

������� �

�� �

�������

�� �� �����

������� �

�� �

��� ��� ��� ��� ���

��� ��� ��� ��� ���

� � � � �

�� �� �� �� ��

� � � � �

��� ��� ��� ��� ���

���� Nf =� � 1=� p � ���� ����

Zvezna frekven�na porazdelitev Pri zvezni spremenljivki X, vrednosti spremenljivke lahko ležijo kjerkoli na dolo�enem intervalu. Zato moramo zvezno spremenljivki najprej razdeliti na nekaj manjših podintervalov – razredov. Frekvence spremenljivke X potem dobimo tako, da preštejemo koliko enot pade v posamezen podinterval.

Nf

p = ;

iii fFFfF +== −111 ;

NF

H =

možnost razdelitve zvezne spremenljivke v podintervale je s pomo�jo Sturgessovega pravila �

� Nlog3,31 n razredov število += , pri �emer je N število enot, ki jih prou�ujemo

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 5

'�( ���% ��( ���� Ranžirne vrste Rang

negrupirani podatki

−+

−+

−−

=−−

RRxx

RRxx

x

� −+

−− −

−+=

xxxx

RRx

grupirani podatki

k

kk

k

iix x

rxffR

∆−

+= −−

=� 1

1

1

Kvantilni rang

NR

P xx

5,0−= � kvantilni rang se ra�una po istem postopku za negrupirane in grupirane podatke

Kvantili Dan je kvantilni rang P (0<=P<=1)

negrupirani podatki

PnP xx )*1( +=

grupirani podatki

kk

k

ii

kP xf

fNPrx ∆

−+=

�−

=−

1

11

Kvartili So vrednosti, ki razdelijo prou�evane podatke popualcije ali vzorca na 4 enake dela � Q1, Q2, Q3 … torej tem kvartilom pripadajo kvantilni rangi PQ1=0.25, PQ2=0.50, PQ3=0.75,

Mere srednje vrednosti Aritmeti�na sredina – to�ka ravnotežja

negrupirani podatki

n

xx

n

ii�

=

grupirani podatki

n

fxx

K

iSi�

=

Mediana

negrupirani podatki

21+= NxMe

grupirani podatki

kk

k

i

k xf

fN

rMe ∆−

+=�

1

11

2;

Modus

negrupirani podatki � najpogostejša vrednost, ki se pojavi v

podatkih

grupirani podatki

kkkkk

kkk x

ffffff

rMo ∆−+−

−+=

+−

−− )()( 11

11

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 6

Harmoni�na sredina

negrupirani podatki

�=

= N

i i

H

x

Nx

1

1

grupirani podatki

=

== K

i Si

i

K

ii

H

xf

fx

1

1

Geometri�na sredina sredina

negrupirani podatki N

NG xxxx ⋅⋅= ...21 grupirani podatki

N fSk

fS

fSG

Kxxxx ⋅⋅= ...2121

Mere razpršenosti podatkov Variacijski razmik

minmax xxR −=

Varianca Najpogostejša mera razpršenosti podatkov … ra�una povpre�ni odklon kvadriranih vrednosti od aritmeti�ne sredine.

negrupirani podatki

N

Nx

N

xN

ii

N

ii ��

==

−=

−= 1

22

1

2

2

)( µµσ (populacija)

11

)(1

22

1

2

2

−=

−=

��==

n

xnx

n

xxs

n

ii

n

ii

(vzorec)

grupirani podatki

N

Nfx

N

xfK

iSi

K

iSi ��

==

−=

−= 1

22

1

2

2

)( µµσ (populacija)

11

)(1

22

1

2

2

−=

−=

��==

n

xnfx

n

xxfs

K

ii

K

ii

(vzorec)

Standardni odklon

2σσ = (populacija) 2ss = (vzorec)

Koeficient variacije

xs

kv =

N ali n=število podatkov, ki jih prou�ujemo (�e delamo na podlagi vzor�nih podatkov, potem število podatkov ozna�imo z n) K=število razredov v frekven�ni porazdelitvi k=razred na katerega se nanaša izra�un fi=frekvenca i-tega razreda; fk=frekvenca k-tega razreda

xSi=sredina razreda rk-1=spodnja meja k-tega razreda

∆xk=širina k-tega razreda

indeksi k-1 ali k+1 pomenijo vrednosti pred (k-1) oz. za (k+1) k-tim razredom

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 7

Opisovanje normalne frekven�ne porazdelitve ��ima en sam vrh, in sicer nad aritmeti�no sredino=mediana=modus ��glede na srednjo vrednost je popolnoma simetri�na ��repi normalne porazdelitve grejo levo in desno od centra se asimptoti�no bližajo vododravni osi

aritmeti�na sredinamedianamodus

�)�!

�)$

�)�

�)�

�)�

�)$

�)�!

σ1− σ1+

σ2− σ2+

σ3− σ3+

=cca. 68%

=cca. 95%

=cca. 99% Mere oblik frekven�nih porazdelitev Asimetri�nost negrupirani podatki

3

1

2

1

3

1

)(1

)(1

��

���

� −

−=

=

=

N

ii

N

ii

xxN

xxNg

grupirani podatki

3

1

2

1

3

1

)(1

)(1

��

���

� −

−=

=

=

K

iii

K

iSii

xxfN

xxfNg

Opomba: spodnji del formule predstavlja varianco!

Sploš�enost negrupirani podatki

2

1

2

1

4

2

)(1

)(1

��

���

� −

−=

=

=

N

ii

N

ii

xxN

xxNg

grupirani podatki

2

1

2

1

4

2

)(1

)(1

��

���

� −

−=

=

=

K

iSii

K

iSii

xxfN

xxfNg

Opomba: spodnji del formule predstavlja varianco!

Fisherjev koeficient sploš�enosti: 32 −= gγ

Opomba: za normalno porazdelitev je g2=3!

�e se koeficinta asimetri�nosti in sploš�enosti bistveno razlikujeta od NI�, se frekven�na porazdelitev bistveno razlikuje od normalne!!!

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 8

*������ �������� �� ��&���������� Porazdelitveni zakon diskretne slu�ajne spremenljivke – verjetnostna porazdelitev

ξ x1 x2 … xk … xn ---

P(ξ =x) p1 p2 … pk … pn 11

=�=

n

iip

Porazdelitvena funkcija diskretne slu�ajne spremenljivke

�≤

=xx

ii

pxF )(

Aritmeti�na sredina – matemati�no upanje diskretne slu�ajne spremenljivke

�=

==n

iii pxM

1

)(ξµ

Varianca diskretne slu�ajne spremenljivke

( )( ) �=

=−==−==n

iii pxMMMVMMV

1

2222222 )( je�emer pri );()()()( ξξξξσξξξσ

Standardni odklon diskretne slu�ajne spremenljivke

)(ξσ V=

+��� ��������� �����%�� ���&��( � ������� Binomska slu�ajna spremenljivka

Porazdelitveni zakon

knk qpk

nkP −

���

����

�== )(ξ

Matemati�no upanje

M( )ξ =np

Varianca in standardni odklon

npq ;)( === VnpqV σξ

Poissonova porazdelitev Porazdelitveni zakon

!)(

ke

kPk λλξ

==

rekurzivna formula:

kkPkP

λξξ )1()( −===

Matemati�no upanje

λξ =)(M

Varianca in standardni odklon

λσλ === VV ;

Negativna binomska porazdelitev Porazdelitveni zakon

rkrrkr qpr

kqp

rk

kkP −−

���

����

−−

=���

����

−−

==111

)(ξ

Matemati�no upanje

pr

M =)(ξ

Varianca in standardni odklon

22 )( ;)(prq

Vprq

V === ξσξ

Preliminarno poro�ilo

Stat is t ika in ver je tnos t � 9

,�� �������� �� ��&����������Normalna porazdelitev

Zna�ilnosti normalne porazdelitve:

– en vrh (M=Me=Mo) – popolnoma simetri�na – repi krivulje se ne dotikajo osi x

gostota verjetnosti ���� ��

���

� −−

= σµ

πσ

x

exf 21

21

)(

Standardizirana normalna porazdelitev

σµ−= x

z

10

M(x)= 4 M(x)= 12 M(x)= 20

S(x)= 1

S(x)= 2

S(x)= 1

0 1 2 3-1-2-3

Preliminarno poro�ilo

Preliminarno poro�ilo

Stat i s t ika in ver je tnos t � 11

Aproksimacija binomske v normalno

σµ−= x

z pri �emer je: np=µ

npq=σ

-�� ���� ���&���( �����&&��������To�kasta ocena Izra�unamo jo po formuli za parameter ... npr. za aritmeti�no sredino ...

Intervalska ocena

ασ

µ −=<−<−=<<− 1)()( knx

kPkzkP .

Na podlagi tega pa lahko dolo�imo interval zaupanja za povpre�je populacije:

nkx

nkx

σµσ +≤≤−

Velikost vzorca

Zahteva � dx ≤− µ

Potrebna velikost vzorca � 2

��

���

�≥d

kn

σ

Preliminarno poro�ilo

Stat i s t ika in ver je tnos t � 12

.������ ���/�&��������( ���% ������� ��Kaj je to … preverjanje predpostavk o parametrih populacije 1. Najprej postavimo ni�elno in alternativno hipotezo H0: M=A H1: M ≠ A

2. Na podlagi stopnje zaupanja α−1 , oziroma stopnje tveganja (tudi napake 1. vrste) α dolo�imo

interval sprejemanja hipoteze � -k ≤−≤ nAx

σk

64,110,090,01 ===− kαα

96,105,095,01 ===− kαα

58,201,099,01 ===− kαα

3. S testom hipoteze z za preverjanje aritmeti�ne sredine na podlagi vzor�nih podatkov izra�unamo vrednost testa hipoteze:

nAx

zσ−=

4. Pogledamo ali izra�unan test hipoteze z pade znotraj intervala sprejemanja hipoteze (-k,+k) � s

stopnjo tveganja α sprejememo sklep o sprejetju alternativne hipoteze (“ni�elno hipotezo

sprejememo”), ali pade izven intervala sprejemanja hipoteze (-k,+k) � ni�elno hipotezo zavrnemo

pri stopnji tveganja α .

Preliminarno poro�ilo

Stat i s t ika in ver je tnos t � 13

0���������� �����������Enostavna linearna regresija in korelacija

X Y X2 Y2 XY x1 y1 x1

2 y12 x1y1

x2 y2 x22 y2

2 x2y2 ... ... ... ... ... xn yn xn

2 yn2 xnyn

� =

n

i ix1 � =

n

i iy1 � =

n

i ix1

2 � =

n

i iy1

2 � =

n

i ii yx1

Najprej izra�unamo delne vsote:

( ) 2

1

2

1

2 xnxxxSn

ii

n

iixx −=−= ��

==

( ) 2

1

2

1

2 ynyyySn

ii

n

iiyy −=−= ��

==

( )( ) yxnyxyyxxSn

iii

n

iiixy −=−−= ��

== 11

Na podlagi tako izra�unanih delnih vsot najprej izra�unamo oceno parametra β :

xx

xy

S

Sb = , in nato še oceno parametra α : xbay += � xbya −=

Skupna ali za�etna varianca: ( )11

1

1

22

−=−

−= �

= n

Syy

ns yy

n

iiY

Nepojasnjena varianca: ( ) ( )xyyy

n

iiie bSS

nbxay

ns −

−=+−

−= �

= 21

)(2

1

1

22

Pojasnjena varianca: 222eyxy sss −=

Determinacijski koeficient: 2

2

2

22

1y

e

y

ey

ss

s

ssD −=

−=

Korelacijski koeficient: xxyy

xy

SS

Sr = ... velja tudi: D ≈ r2

Koeficient korelacije ranžirnih vrst ... ali Spearmanov koeficient korelacije

( )� =−

−−= n

i iiS vwnn

r1

22 )1(6

1

Preliminarno poro�ilo

Stat i s t ika in ver je tnos t � 14

1��� ��������Metoda drse�ih sredin perioda drsenja: m � nm ≤≤1 (n je število podatkov, ki jih prou�ujemo)

Za�etno napoved delamo za obdobje m+1:

myyy

y mm

+++=+

...211

Nadaljnje napovedi pa lahko ra�unamo po formuli:

myy

yy mtttt

−+

−+= ''

1 ; �e je m velik potem predpostavljamo veliko slu�ajnih vplivov

Metoda eksponentnega glajenja faktor glajenja: g � 10 ≤≤ g

Za za�etno napoved vzamemo kar:

1'1 yy =

Nadaljnje napovedi pa ra�unamo po formuli:

)( '''1 tttt yygyy −+=+ ; �e je g majhen potem predpostavljamo veliko slu�ajnih vplivov

Model �asovne vrste Najprej obdobje opazovanja spremenimo v tehni�ni �as � pri katerem je njegova vsota enaka 0 …

T Y X Y2 YX X2

T1 y1 x1 y12 y1x1 x1

2

T2 y2 x2 y22 y2x2 x2

2

… … … … … …

Tn yn xn yn2 ynxn xn

2

=

n

iiy

1

01

=�=

n

iix �

=

n

iiy

1

2 �=

n

iii yx

1

�=

n

iix

1

2

n

ya

n

ii�

== 1 ;

=

== n

ii

n

iii

x

yxb

1

2

1 � T = a + bx

��2���� ����� �( ����%��� �/������Tempo rasti

1001

1 ⋅−

=−

k

kkk y

yyT

Koeficient dinamike

1−

=k

kk y

yK

Verižni indeks

1001

⋅=−k

kk y

yV

Bazni indeks

1000

0, ⋅=yy

I kk