5 tema. Matematinės statistikos pradmenys
description
Transcript of 5 tema. Matematinės statistikos pradmenys
1
5 tema. Matematinės statistikos pradmenys
Matematinė statistika nagrinėja:
1. Eksperimentų rezultatų apdorojimo būdus
2. Statistines išvadas
Matematinės statistikos dalys:
1. Įverčių teorija.
2. Hipotezių tikrinimas.
2
Matematinės statistikos metodų charakteristika
1. Įverčių teorijos sritis – metodai,taikant kuriuos
nustatoma: 1) Empirinė atsitiktinio dydžio pasiskirstymo funkcija
2) Jo skaitinės charakteristikos
2. Statistinės išvados – hipotezių tikrinimas• Statistinė hipotezė – tai prielaida
apie empirinį atsitiktinio dydžio pasiskirstymo dėsnį ir/arba apie jo empirines skaitines charakteristikas.
3
Įverčių teorija
Skirtumas tarp tikrosios ir nustatytos iš imties skaitinių charakteristikų reikšmių ,
vadinamas imties paklaida.• Formulės:• 1. Pasikliautinoji tikimybė:
• čia Q – pasikliautinoji tikimybė; • m – empirinis vidurkis;• m – tikrasis, bet tyrėjui nežinomas vidurkis;• ε – bet koks pakankamai mažas dydis
)~( mmPQ
4
Įverčių teorija
2. Reikšmingumo lygmuo:
3. Pasikliautinasis intervalas
2
1 Q
]~,~[ mm
5
Įverčių teorija
4. Nagrinėjamas atsitiktinis dydis T:T = (m-m)/ S*,
S* - atsitiktinio dydžio m standartinis nuokrypis
–imties su numeriu i elemento reikšmė; n – elementų skaičius imtyje.
Atsitiktinis dydis T yra pasiskirstęs pagal Stjudento dėsnį.
•
)1(
)~(1
2
nn
mxS
n
ii
ix
6
Praktiški skaičiavimai
1. Turime n stebėjimo rezultatų.2. Apskaičiuojame tos imties reikšmių empirinį vidurkį m.3. Pasirenkame pageidaujamos pasikliautinosios tikimybės Q
dydį.
Reikia rasti pasikliautinąjį rėžį, atitinkantį tą tikimybę Q.4. Randame šio atsitiktinio dydžio standartinį nuokrypį S*.
5. Pagal stebėjimų skaičių n ir pasikliautinąją tikimybę Q
randame parametrą tα (žr. 1 priedą)6. Padauginame šią reikšme iš S*
ir gauname ε reikšmę, t.y. ε = tα S*.7. Ieškomasis pasikliautinasis rėžis yra [m- ε, m+ ε].
7
Audito rizika
Rizika gali būti dvejopos prigimties:
1. Audituojamojo, kai nepaisant to, kad organizacijos veikla yra gera, suformuluojama neigiama išvada;
2. Audito, kai suformuluojama teigiama išvada, nors organizacijos veikloje yra esminių trūkumų.
8
Rizikos pasiskirstymas tarp audituojamojo ir auditoriaus
Audito išvada Tikroji padėtis
Mažai neatitikimų
Daug neatitikimų
Neatitikimai neviršija leistino lygio
Teisinga išvada Audito rizika
Neatitikimai viršija leistiną lygį
audituojamojo rizika
Teisinga išvada
9
Audito rizikos tipai:
• Įgimta rizika – nukrypimai nuo optimalios veiklos strategijos dėl neveikiančios vidaus kontrolės (ĮR)
• Kontrolės rizika – rizika, kad vidaus kontrolė laiku nepastebės ir neištaisys nukrypimų (KR)
• Neaptikimo rizika –audito metu nebus nustatyti vidaus kontrolės neištaisyti veiklos trūkumai (NR)
• Audito rizika: AR = ĮR x KR x NR
10
Įgimtą riziką įtakojantys veiksniai:
• Veiklos pobūdis;• Veiklą reguliuojančios teisinės bazės
trūkumai;• Audituojamos institucijos personalo
kompetencijos, patirties, sąžiningumo stoka;
• Struktūros sudėtingumo laipsnis;• Nerealių reikalavimų egzistavimas;• Neįgyvendinti ankstesnių auditų rezultatai.
11
Kontrolės ir neaptikimo riziką įtakojantys veiksniai:
• 1. Vidaus kontrolės:• Vidaus auditorių skaičius• Jų kompetencija, kvalifikacija ir kruopštumas• Naudojamų metodikų kokybė• Atliekamų procedūrų tinkamumas ir išsamumas• 2. Neaptikimo rizika:
• specifinių situacijų neatpažinimas;• nekvalifikuotų ar netinkamų auditorių atranka;• netinkamų metodikų ir procedūrų panaudojimas;• Netiksli rezultatų interpretacija;• lėšų ir laiko stoka.
12
Audito rizikos matricaNeaptikimo rizika
Įgimta
rizika
Kontrolės rizika
Maža Vidutinė Aukšta
Maža Labai
aukšta
Aukšta Vidutinė
Vidutinė Aukšta Vidutinė Maža
Aukšta Vidutinė Maža Labai
maža
13
Įgimtos ir kontrolės rizikos lygiai (Lenkija)
Rizikos
tipas
Rizikos lygis
Žemas Vidutinis Aukštas
Įgimta
rizika
45% 65% 100%
Kontrolės rizika
17% 28% 100%
14
Neaptikimo rizikos apskaičiavimo pavyzdys
Įgimta rizika
Vidutinė, proc.
Kontrolės
Rizika, proc.
Neaptikimo
Rizika
65 Maža 17
65 Vidutinė 28
65 Aukšta 100
45.017.0*65.0
05.0NR
27.028.0*65.0
05.0NR
08.01*65.0
05.0NR
15
Statistinės išvadosHipotezės
1. Hipotezė – tai prielaida apie populiacijos požymių reikšmes
2. Tikrinama hipotezė yra vadinama nuline hipoteze ir žymima H03. Tradiciškai H0 yra hipotezė apie lygybę, t.y. „nulinį“ skirtumą. 4. Jai priešinga hipotezė žymima H1 ir vadinama alternatyviąja5. Hipotezėms tikrinti naudojami statistiniai kriterijai – taisyklės,
kuriomis remiantis hipotezės pripažįstamos teisingomis arba klaidingomis
• Kritinė sritis – tai aibė reikšmių, kurias statistikai įgijus nulinė hipotezė atmetama.
• Kritinė reikšmė – tai skaičius, kuris atskiria kritinę sritį nuo hipotezės neatmetimo srities.
16
Pirmosios ir antrosios rūšies paklaidos
• Tikimybė atmesti nulinę hipotezę, kai ji yra teisinga, – I rūšies klaida α – reikšmingumo lygmuo
• Tikimybė neatmesti nulinės hipotezės, kai ji klaidinga, - II rūšies klaida β
• Tikimybė atmesti nulinę hipotezę, kai ji yra klaidinga, vadinama kriterijaus galia
17
Pirmosios ir antrosios rūšies klaidos
Sprendimas
Tikroji padėtis
Nulinė hipotezė
teisinga
Nulinė hipotezė
neteisinga
Neatmesti nulinę hipotezę
Teisingas sprendimas II rūšies klaida
Atmesti nulinę hipotezę
I rūšies klaida
Reikšmingumo lygmuo:
Teisingas sprendimas
Kriterijaus galia:
p1p
p 1p
18
Kriterijaus galia
• Tikimybė pagrįstai atmesti nulinę hipotezę, jei ji yra klaidinga, vadinama kriterijaus galia.
• Jeigu teisinga nulinė hipotezė, tai tikimybė, kad testo statistika įgys reikšmes didesnes už kritinę reikšmę, yra lygi α.
• Kritinė reikšmė dalina statistikos skirstinį į dvi dalis.
• Kairioji alternatyvaus skirstinio dalis yra β – tikimybė priimti klaidingą nulinę hipotezę,
• Dešinioji jo dalis yra kriterijaus galia - tikimybė atmesti klaidingą.
19
Kriterijaus galia
• Galią įtakojantys veiksniai:
• Skirtumas, kurį norima aptikti: Kuo didesnį skirtumą norėtume aptikti, tuo didesnis būtų atstumas tarp nulinio ir alternatyviojo
pasiskirstymo tankio funkcijų; • Tiriamojo parametro dispersija: Kuo mažesnė . dispersija, tuo siauresnės būtų nulinio ir
alternatyviojo pasiskirstymo tankio funkcijos;
• imties dydis, kuris įtakoja pasiskirstymo funkcijų formą
20
Imties dydis
I. Kai vertinamos vieno atsitiktinio dydžio skaitinės charakteristikos
II. Kai vertinamos dviejų atsitiktinių dydžių skaitinių charakteristikų lygybė – hipotezių tikrinimas
21
Imties dydisI
1. Atsitiktinis dydis normalus2. Žinomas standartinis nuokrypis
• Uždavinys:• kiek reikia duomenų, kad vidurkis,• nustatytas iš tų duomenų imties,• atitiktų patikimumo ir tikslumo
reikalavimus
22
Imties dydis I
• Sprendimas:
• - standartizuoto normaliojo skirstinio kritinė reikšmė
2
22
4
l
zn
2l
2
1 Q
z
23
Imties dydis I
1. Atsitiktinis dydis nėra normalus2. Standartinis nuokrypis nežinomas Imties dydis - Stjudento dėsnio α lygmens kritinė
reikšmė• – empirinė dispersija• - empirinis vidurkis
2,)1( 2
2
ll
sntn
)1( nt
2
s
m~
24
Imties dydis I
• 3. Proporcijų įverčiai:• Pasikliautinojo intervalo ilgis išreiškiamas
tokia nelygybe:
• Imties dydis
n
zl
2
2
4zn
25
Imties dydis II
• Pagrindiniai veiksniai, įtakojantys imties dydį yra:
• reikšmingumo lygmuo α;• galia 1-β;• tyrimui reikšmingas skirtumas δ, kurį norima
aptikti;• tiriamų populiacijų standartiniai nuokrypiai,
kurie dažniausiai nėra žinomi. • Jų reikšmės paprastai įvertinamos remiantis
ankstesnių tyrimų rezultatais, patirtimi arba naudojantis specialiaisiais metodais.
26
1. Imties dydis populiacijų vidurkių palyginimo atveju
• Dvi populiacijos• Tarkime, kad auditorius nori patikrinti, ar
dviejų populiacijų tiriamųjų požymių vidurkiai yra vienodi,
• Kokio dydžio imtis jis turėtų išrinkti iš tiriamų populiacijų, kad su pasirinktu reikšmingumo lygmeniu ir galia galėtų pagrįstai teigti, kad skirtumas tarp imčių vidurkių yra statistiškai reikšmingas?
27
1. Imties dydis populiacijų vidurkių palyginimo atveju
• Dvi populiacijos, imčių dydžiai vienodi, standartiniai nuokrypiai skirtingi
• Imčių dydžiai:
• α - reikšmingumo lygmuo, • β – kriterijaus galia, • δ – tyrimui reikšmingas skirtumas, kurį norima
aptikti, • σ1 ir σ2 – standartiniai nuokrypiai,
2
22
2
2
1111 )2(
zzn 21
~~ mm
28
1. Imties dydis populiacijų vidurkių palyginimo atveju
• Dvi populiacijos, imčių dydžiai vienodi, standartiniai nuokrypiai vienodi:
• Imčių dydžiai:
2
21
2
11
2
)~~(
)(2
mm
zzn
29
1. Imties dydis populiacijų vidurkių palyginimo atveju
• Dvi populiacijos, imčių dydžiai skirtingi: m<n, standartiniai nuokrypiai vienodi:
• Imčių dydžiai:• Pirmosios – m• Antrosios vietoj n reikia l dydžio imties:
nm
mnl
2
30
1. Imties dydis populiacijų požymių proporcijų palyginimo atveju
• Lyginamų imčių dydis turi būti:
• -lyginamų proporcijų reikšmės
2
21
2
11
)(2
)(
pp
zzn
21, pp
31
Imties dydis esant n populiacijoms ir k kategorijoms
• Turime • N=n*k dydžio imtį
• Norime aptikti skirstiniuose
• dydžio skirtumus
Imties dydis turi būti:
21~~ mm
2
2
)1)(1(,
knN
32
Hipotezės apie homogeniškumą tikrinimas
• Tikrinama, ar kelios skirtingos populiacijos tam tikro požymio atžvilgiu yra vienodos (homogeniškos)
• Nagrinėjamos r skirtingoso puliacijos.• Vertinamas kiekvienos iš jų vienas
kategorinis kintamasis, susidedantis iš c kategorijų.
• Surinktus duomenis galima surašyti dažnių lentelėje (9 lentelė).
33
Hipotezės apie homogeniškumą tikrinimas
• Skirtingų populiacijų kategorinio kintamojo dažniai
Populiacijos Nr.
Kintamojo kategorija Iš viso
1 2 C
1
2
r
n
in
jm 1m 2m cm
1n
2n
rn
11o co112o
34
Hipotezės apie homogeniškumą tikrinimas
• Kriterijaus statistika
• Antroji šios formulės dalis – tikėtini dažniai• Laisvės laipsnių skaičius (c-1)(r-1)• Sprendimas: mulinė hipotezė atmetama, jei
apskaičiuta statistika didesnė už teorinę jos reikšmę
r
i
c
j
jiij
ij
ijij
n
mne
e
eo
1 1
22
,)(
35
Hipotezės apie homogeniškumą tikrinimas
• Taikant šį kriterijų reikia. kad:
1. Imtis būtų ne mažesnė nei 30.
2. Ne daugiau nei ketvirtadalis gardelių reikšmių būtų mažesnės nei 5.
3. Sprendimas: jei p<α, nulinė hipotezė atmetama
36
Hipotezės apie nepriklausomumą tikrinimas
• Kriterijus, veiksmai ir išvados analogiškos kaip ir tikrinant homogeniškumą
• Skirtumai:
1. 1 Stulpelyje išdėstomos vieno kintamojo reikšmės
2. 1 Eilutėje išdėstomos kito kintamojo reikšmės
3. Jei apskaičiuota statistika didesnė už teorinę, – kintamieji priklausomi