Stat1 Teooria

34
MATEMAATILINE STATISTIKA I Andmete esitlus II Andmeanalüüs

Transcript of Stat1 Teooria

Page 1: Stat1 Teooria

MATEMAATILINE STATISTIKA

I Andmete esitlus

II Andmeanalüüs

Page 2: Stat1 Teooria

STATISTIKA: andmete esitlus

5. Jaotustabel

2. Statistiline kogum: variatsioonrida, sagedustabel.

Sirglõikdiagramm

3. Näide1: punktile 2

4. Suhteline sagedus. Näide 2

1. Statistiline andmestik

6. Klassid. Histogramm. Sektordiagramm

Harjutused: 1 2 3

Esileht

Page 3: Stat1 Teooria

Statistiline andmestik

Determineeritud seosed lad. Determinãre – ette ära määrama

Determineerimata seosed Statistiline kogum (valim )

Tunnus

Arvuline tunnus Mittearvuline tunnus

Pidev Diskreetne Järjestatud Nominaalne

Tagasi

Edasi

Page 4: Stat1 Teooria

Statistiline kogum

Statistiline rida a1 , a2 , a3 , …, aN

statistilise rea liikmed

N - kogumi(statistilise rea) maht N = f1 + f2 + … +fN

Variatsioonrida – statistilise rea liikmed kasvavas või kahanevas järjekorras.

Sagedustabel

fN…f2f1Sagedus ( f )

xN…x2x1Tunnuse väärtus ( x )

TagasiNäide

Edasi

Page 5: Stat1 Teooria

Variatsioonrida. Sagedustabel. Sagedushulknurk. Näide 1 Klassi kontrolltöö hinded olid: 2,2,2,3,4,5,5,5,5,5,3,3,3,4,4,4,5,5,5,3,3,3,4,4,4,4,4,4

Variatsioonrida:

Sagedustabel Sagedushulknurk

e. sirglõikdiagramm

Kogumi maht 81073Sagedus ( f )

5432Hinne ( x )

0

2

4

6

8

10

12

2 3 4 5 x

f

Esileht

Edasi

Eelminelk

2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5

N = 3 + 7 + 10 + 8 = 28

Page 6: Stat1 Teooria

Suhteline sagedus.Näide 2. Aluseks näide 1 ja lisame ka teise klassi tulemused

0

2

4

6

8

10

12

2 3 4 5 x

f

6952Sagedus ( f ) kl B

81073Sagedus ( f ) kl A

5432Hinne ( x )

Andmeid ei saa võrrelda, sest maht ja hinde osakaal erinev kummaski klassis.

Et võrrelda erineva mahuga kogumeid kasutatakse suhtelist sagedust

%100%

Nfwvõi

Nfw

Esileht

Edasi

Eelminelk

Page 7: Stat1 Teooria

Jaotustabel. Jaotushulknurk.

wN…w2w1Suhteline sagedus (w)

xN…x2x1Tunnuse väärtus ( x )

Seejuures w1 + w2 +…+wN = 1

2741239WB (%)

28362511WA (%)

5432x

051015202530354045

2 3 4 5 X

w(%)

Esileht

Edasi

Eelminelk

Page 8: Stat1 Teooria

Tunnuse väärtuste klassid. (1)

Kui tunnuse vääruseid on palju, siis esitatakse need klassidena.

Klasside arv NKlasside otspunktid – klassipiirid

Klassi pikkusN

xx minmax wm-1fm-1

………

w2f2

w1f1

Suhteline sagedus(w%)

Sagedus (f)Klassid

21 kxk

32 kxk

mkxmk 1

Klasse võib märkida: k1…k2 või k1 – k2. Sel juhul klassi piiril olev arv loetakse madalamasse klassi

Tagasi

Edasi

Page 9: Stat1 Teooria

Tunnuse väärtuste klassid. (2)

Ühe klassi õpilaste pikkuste (cm)variatsioonrida on järgmine:156,158,159,160,160,162,163,163,163,165,165,165,166,166,167,167,167,167,168,168,168,169,170,171,171,172,173,173,173,174,174,176,184.

Klasside arv:5,73333N

Sobiv klasside arv on 5 või 6.Klassi pikkus

5(cm)6

156184

(w%)fKlassid (cm)

160155 x

165160 x

170165 x

175170 x

180175 x185180 x

5

7

11

8

1

1 3

3

24

34

21

15

33 %100

Tagasi

Histo-gramm

Sektor-diagramm

Page 10: Stat1 Teooria

Tunnuse väärtuste klassid. (3)

Kui sagedus- või jaotustabelis on väärtused esitatud klassi-dena, siis kujutatakse neid geomeetriliselt tulpdiagram-mina e. histogrammina 15

21

34

24

3 3

0

5

10

15

20

25

30

35 w(%)

155-160

160-165

165-170

170-175

175-180

180-185

x

Sobib esitada andmed ka sektordiagrammina

Eelminelk

Tagasi

Page 11: Stat1 Teooria

Tunnuse väärtuste klassid. (4)

155-16015%

160-16521%

165-17034%

170-17524%

175-1803%

180-1853%

Eelminelk

Tagasi

Page 12: Stat1 Teooria

Harjutus (I 1)

Milline järgmistest tunnustest on diskreetne, milline pidev ja milline mittearvuline?

Kaal

Kinga nr

Töökoht

Vanus

Haridus

Kasv

Sugu

Nimi

MittearvulineDiskreetnePidev

Tagasi

+

+

+

+

+

+

+

+

Harjutus 2

Page 13: Stat1 Teooria

Harjutus (I 2)

Kaupluses müüdi tunni ajaga 20 paari kingi

numbritega:

39,41,40,41,44,40,42,41,43,39,42,41,42,38,42,41,43,

41,39,40.

Mis tüüpi on tunnus?

Koosta variatsioonrida.

Koosta sagedustabel ja sagedushulknurk..

Sagedustabel Sagedushulknurk

Diskreetne

Tagasi

Harjutus 3

Page 14: Stat1 Teooria

Harjutus (I 2.1) sagedustabel

1246331f

44434241403938x

Tagasi

Page 15: Stat1 Teooria

Harjutus (I 2.2) sirlõikdiagramm

1

3 3

6

4

2

1

0

1

2

3

4

5

6

7

38 39 40 41 42 43 44

Tagasi

Page 16: Stat1 Teooria

Harjutus (I 3)

298140255178215159144385321188204184163121Käive

1413121110987654321Kauplus

Tabelis on 14 kaupluse keskmine käive ühes päevas tuhandetes kroonides.

Koostage tunnuse käive sagedustabel ja jaotustabel ning neile vastavad histogrammid. Valige sobiv klassijaotus!

Tagasi

Page 17: Stat1 Teooria

Harjutus (I 3.1). Sagedus- ja jaotustabel

w(%)

f

319-385253-319187-253121-187

Klasside arv 414

Klassi pikkus 664

121385

7 3 2 2

50 21,4 14,3 14,3

Tagasi

Page 18: Stat1 Teooria

Harjutus (I 3.2). Tulpdiagrammid.

50

21,414,3 14,3

0

20

40

60

187 253 319 385

käive(tuh.kr)

w(%)

7

32 2

0

2

4

6

8

187 253 319 385

käive(tuh.kr)

f

Tagasi

Page 19: Stat1 Teooria

STATISTIKA: andmeanalüüs

Esileht

Paiknemise karakteristikud

Hajuvuse karakteristikud

Page 20: Stat1 Teooria

Paiknemise karakteristikud. (1)

Näitavad tunnuse väärtuste paiknemist arvteljel ja iseloomustavadtunnust keskmise väärtuse seisukohalt

Aritmeetiline keskmine

Mediaan

Mood

x

eM

oM

Näited: 1 2 3

Page 21: Stat1 Teooria

Aritmeetiline keskmine.

Eelmine lk

Kui tunnuse väärtused on a1 , a2 , a3 , …, aN , siis

N

ii

N aNN

aaax

1

21 1...

Kui andmestik on sagedus- või jaotustabelina

wn…w2w1w

fn…f2f1f

xN…x2x1x

N

iii fx

Nx

1

1

N

fwwxx i

i

N

iii

,

1%100,

1001

1

N

fwwxx i

i

N

iii või

Tunnuse kõigi väärtuste summa jagatis väärtuste objektide arvuga

Page 22: Stat1 Teooria

Mediaan.

Eelminelk

Tunnuse väärtus, millest suuremaid (või võrdseid) ja väiksemaid (või võrdseid) on variatsioonreas ühepalju.

Kui variatsioonreas on liikmeid paaritu arv

)1(21

, NixM ie

Kui variatsioonreas on liikmeid paarisarv

2

,21

1N

ixxM iie

Page 23: Stat1 Teooria

Mood.

Eelminelk

Tunnuse kõige sagedamini esinev väärtus

Kui tunnusel on kaks moodi siis öeldakse, et tunnus on bimodaalne.

Kui tunnusel on rohkem kui kaks moodi , siis öeldakse,et tunnus on multimodaalne.

Page 24: Stat1 Teooria

Näide (1)

Tagasi

Laskur tegi 15 lasku märklauda ja tulemused olid :10, 10, 8, 9, 7, 10, 8, 8, 8, 6, 6, 7, 9, 10, 8 silma.

Leidke keskmine silmade arv ühe lasuga.Tunnuse mediaan ja mood.

Tunnuse variatsioonrida on :6, 6, 7, 7, 8, 8, 8, 8, 8, 9, 9, 10, 10, 10, 10

827,815

1010101099888887766

x

Me = x8 = 8 Mo = 8

Page 25: Stat1 Teooria

Näide (2)

Tagasi

1246331f

44434241403938x

Leidke jaotustabeliga antud tunnuse keskväärtus, mediaan ja mood.

4195,4044143242441640339338120

1x

Tabel iseloomustab kaubamajas keskmiselt ühes tunnis müüdud jalatsite jaotust vastavalt numbritele

Me on 2

1110 xx Me = 41

Mo = 41

Page 26: Stat1 Teooria

Näide (3)

Tagasi

1180-185

1175-180

11170-175

7165-170

8160-165

5155-160

Klassi esindaja xifiPikkus X

5,157

5,162

5,1675,172

5,177

5,182

Leidke tunnuse keskväärtus, mediaan ja mood.

2,1675,18215,17715,172115,16775,16285,157533

1x

Mediaan on 17 liige variatsioonreas

Mood Mo on vahemik 170-175, sest seal on 11 objekti või

Mo = 172,5, kui vahemiku 170-175 esindaja

a) Me on mediaanivahemik 165-170

b) Me=167,5, kui aluseks on klassi esindajac)Me = 167,9 , kui klassi pikkus on 5 ja objekte seal 7

Page 27: Stat1 Teooria

Hajuvuse karakteristikud

Tagasi

Kvartiilid

Dispersioon. Standardhälve

Varatsioonikordaja

Näide 4

Page 28: Stat1 Teooria

Kvartiilid

Alumiseks kvartiiliks nimetatakse tunnuse väärtust, millest väiksemaid ( või võrdseid ) väärtusi on variatsioonreas 25%.

Tähis QÜlemiseks kvartiiliks nimetatakse tunnuse väärtust, millest suuremaid ( või võrdseid ) väärtusi on variatsioonreas 25%.

Tähis Q

Page 29: Stat1 Teooria

Dispersioon. Standardhälve.

Tagasi

Hälve on tunnuse üksiku väärtuse kõrvalkalle keskmisest.

fn. . .f2f1fi

. . .xxi xx 1 xx 2 xxn Hälvete summa null!

Dispersioon on hälvete ruutude aritmeetiline keskmine

N

fxxfxx nn2

12

12 ...

Mida suurem on dispersioon seda

suurem on tunnuse väärtuste hajumine.NB! Ühik ruutühik

Standardhälve 2σ σ Enamiku tunnuste korral erineb üle poole andmetest aritmeetilisest keskmisest vähem kui standardhälbe võrra. xx ;

Page 30: Stat1 Teooria

Variatsioonikordaja.

Tagasi

Kasutatakse kui uuritakse erinevates ühikutes tunnuste hajuvust või kahe tunnuse aritmeetilised keskmised on liiga suure erinevusega.

xv

Page 31: Stat1 Teooria

Näide (4)

Tagasi

6952f kl B

81072f kl A

5432Hinne x

Sama KT tehti kahes paralleelklassis.Hinnake tunnuste hajuvustkummaski klassis: alumiste ja ülemiste kvartiilide abil;standardhälbe abil; variatsioonikordaja abil.

Kvartiilide põhjal.

Standardhälbe põhjal.

Variatsioonikordaja põhjal.

Page 32: Stat1 Teooria

Näide (4). Kvartiilid

Näide 4

Kogum A: Kogumis on 27 objekti. Alumine kvartiil on 7objekt ja ülemine 21 objekt.

53 QjaQ Kogum B: Kogumis on 22 objekti. Alumine kvartiil on 6. Objekt ja ülemine on17. objekt

53 QjaQ

Kvartiilide erinevused on mõlemal juhul 2. Selle põhjal ei õnnestu hajuvust selgitada. Stand

hälve

Page 33: Stat1 Teooria

Näide (4). Standardhälve.

Näide 4

x1,29960,01960,73963,4596

x1,140,14-0,86-1,86

226952f kl B

7,7976

9,8568

1,2321

1,11

8

5

x0,11-0,89-1,89

x0,01210,79213,5712

23,75391,2105,54477,1424

18,59120,17643,6986,9192

271072f kl A

Summa432Hinne x

xxi

2xxi

ii fxx 2

89,3Ax

86,3Bxxxi

2xxi

ii fxx 2

94,027

7539,23

92,022

5912,18

Et kogumi B standardhälve on väiksem hajub see kogum vähem.

Varkordaja

Page 34: Stat1 Teooria

Näide (4). Variatsioonikordaja

94,027

7539,23 Kogum A: 89,3Ax

2416,089,3

94,0v

Kogum B: 92,022

5912,18 86,3Bx

2383,086,3

92,0v

Et kogumi B variatsioonikordaja on väiksem hajub see kogum vähem