Örnekleme ve Tahminkisi.deu.edu.tr/s.ucdogruk/ISTATISTIKII/1_Örnekleme ve...ÖRNEKLEME TEORİSİ...
Transcript of Örnekleme ve Tahminkisi.deu.edu.tr/s.ucdogruk/ISTATISTIKII/1_Örnekleme ve...ÖRNEKLEME TEORİSİ...
ÖRNEKLEME TEORİSİ VE
TAHMİN TEORİSİ
1
TEMEL KAVRAMLAR
PARAMETRE:
• Populasyonun sayısal açıklayıcı bir ölçüsüdür ve anakütledeki tüm elemanlar dikkate alınarak hesaplanabilir.
• Anakütledeki tek bir eleman dahi işlemin dışında kalır ise elde edilen sonuç parametre olarak kabul edilemez.
ÖRNEK İSTATİSTİĞİ
(PARAMETRE TAHMİNLEYİCİSİ):
• Bir örneğin sayısal betimselölçüsüdür ve örnekteki gözlemlerden hesaplanır.
• Diğer bir deyişle bilinmeyen bir parametrenin sayısal değerini bulabilmek (tahminlemek) için kullanılır.
2
PARAMETRE VE ÖRNEK
İSTATİSTİKLERİ İÇİN ÖRNEKLER
Parametre
• Anakütle ortalaması
• Anakütle Medyanı M
• Anakütle Varyansı 2
• Anakütle Standart
Sapması
• Anakütle Oranı: P veya π
Örnek istatistiği
• Örnek ortalaması
• Örnek Medyanı m
• Örnek Varyansı s2
• Örnek Standart
Sapması s
• Örnek Oranı p
x
3
Bir Populasyon Parametresi Hakkında
En Geniş Bilgiyi Hangi Örnek İstatistiğinin İçerdiğine
Nasıl Karar Verilecek?
Örneğin anakütle ortalaması için
• Aritmetik ortalama
• Geometrik ortalama
• Harmonik ortalama
• Medyan
vb. örnek istatistiklerinden hangisi tercih edilmelidir.
4
Örnek 1a
Bir zar atılışında x üst yüzdeki sayıyı göstersin. E(x)=anakütle parametresini (anakütle ortalamasını) bulunuz.
x 1 2 3 4 5 6
P(x) 1/6 1/6 1/6 1/6 1/6 1/6
xP(x) 1/6 2/6 3/6 4/6 5/6 6/6
6
1
1 2 6 21( ) ( ) ...... 3,5
6 6 6 6x
E x xP x
5
Örnek 1b
• Ancak bu değerinin bir an için bilinmediği
ve bunu tahmin etmek için populasyondan
3 örnek alındığını varsayılsın.
6
• Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2,
x3=6 elde edilsin.
333,33
10
3
622
n
xx ve m=2 hesaplanabilir. m:medyan
1 2 3 4 5 6
m=2
X=3.3
=3.5
SONUÇ: x değeri değerine daha yakındır.
7
• Zar 3 kez daha atılsın ve örnek sonuçları; x1=3, x2=4,
x3=6 elde edilsin.
3,43
13x ve m=4
1 2 3 4 5 6
m
x
SONUÇ: m değeri değerine daha yakındır.
8
Örnek için Yorum
2. Ne örnek aritmetik ortalaması
Ne de örnek medyanı (m),
populasyon ortalamasına daima daha yakındır
denilemez.
Sonuçların genellenebilmesi için örnek istatistiklerinin
dağılışına gerek duyulmaktadır.
x
1. Örnekten hesaplanan örnek istatistikleri (tahminleyiciler)
birer şans değişkenidir.
9
ÖRNEKLEME DAĞILIMLARI
10
• Anakütleden n adet ölçümden x1, …, xn
oluşan bir örnekten alınmış olsun.
• Anakütledeki eleman sayısı N olsun.
• Anakütleden alınabilecek her biri n adet
eleman içeren tüm mümkün örnek sayısı:
Nk
n
11
• Bu koşullar (N, n) altında hesaplanabilecek
örnek istatistiği sayısı k adettir.
• Örnek istatistiğinin anakütlesindeki eleman
sayısı k olur.
• Örnek verilerinden hesaplanan bir örnek
istatistiği için elde edilen bu anakütle
örnekleme dağılışı olarak adlandırılır.
ÖRNEKLEME DAĞILIMLARI
12
ÖRNEKLEME DAĞILIMLARI
• Örnekleme dağılımı bu istatistiğin bir
olasılık dağılışıdır.
• Örnekleme dağılımı anakütledeki eleman
sayısı N ve n örnek hacminin bir
fonksiyonudur.
Örnek 2
13
• Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12)
olasılık dağılışı aşağıdaki gibidir;
n = 3
a) Örnek ortalaması ( )’nın örnekleme dağılışı
b) Örnek medyanı (m)’nın örnekleme dağılışını bulunuz.
• DİKKAT: ANAKÜTLEDEKİ ELEMAN SAYISI N
BİLİNMİYOR. FAKAT ŞANS DEĞİŞKENİNİN OLASILIK
DAĞILIMI P(x) BİLİNİYOR.
x 0 3 12
P(x) 1/3 1/3 1/3
x
Mümkün Örnekler x m Olasılık p= x / n
(x tek sayı
gelmesi durumu)
0 0 0 0 0 1/27 0/3
0 0 3 1 0 1/27 1/3
0 0 12 4 0 1/27 0/3
0 3 0 1 0 1/27 1/3
0 3 3 2 3 1/27 2/3
0 3 12 5 3 1/27 1/3
0 12 0 4 0 1/27 0/3
0 12 3 5 3 1/27 1/3
0 12 12 8 12 1/27 0/3
3 0 0 1 0 1/27 1/3
3 0 3 2 3 1/27 2/3
3 0 12 5 3 1/27 1/3
3 3 0 2 3 1/27 2/3
3 3 3 3 3 1/27 3/3
3 3 12 6 3 1/27 2/3
3 12 0 5 3 1/27 1/3
3 12 3 6 3 1/27 2/3
3 12 12 9 12 1/27 1/3
12 0 0 4 0 1/27 0/3
12 0 3 5 3 1/27 1/3
12 0 12 8 12 1/27 0/3
12 3 0 5 3 1/27 1/3
12 3 3 6 3 1/27 2/3
12 3 12 9 12 1/27 1/3
12 12 0 8 12 1/27 0/3
12 12 3 9 12 1/27 1/3
12 12 12 12 12 1/27 0/3
Örnek 2 Örnek 314
15
Örnek 2
• Aritmetik Ortalama Örnekleme Dağılışı
• Medyan Örnekleme Dağılışı
0 1 2 3 4 5 6 8 9 12
P( ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
xx
m 0 3 12
P(m) 7/27 13/27 7/27
16
Niçin Örnek?Anakütle parametrelerinin örnek değerleri (örnek istatistikleri)
yardımıyla tahmin edilmesine imkan sağlamak modern
istatistiğin önemli bir görevidir.
Anakütlenin tamamı incelenmez.
Anakütleden bir şans örneği alınır.
Elde edilen örnek değerlerinin anakütle parametresi yerine
kullanılması için iki şart vardır:
a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe
girme şansı eşit olmalı
b. Örnek yeterince büyük olmalı
17
Tahminleyicilerin Özellikleri
Sapmasız Sapmalı
BAX
)(XP
1. Sapmasızlık
N birimlik aynı anakütleden farklı sayıda örneklem
seçilebileceği için tahmin edicinin değeri de seçilen
örnekleme göre değişmektedir. Bu durumda örneklem
sayısı kadar elde edilen tahmin edici, bir rassal
değişken olup, ortalaması ve varyansı olan bir olasılık
dağılımına sahiptir. Bu dağılımın beklenen değerinin
anakütle parametresine eşit olmasına, diğer bir ifadeyle
bir istatistiğin beklenen değeri ile bilinmeyen anakütle
parametresi arasındaki farkın sıfıra eşit olmasına
“sapmasızlık” denir. E(X) E(X) 0
18
Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık)
Küçük örnek hacmi
Büyük örnek hacmi
A
B
)X(P
X
Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahminedicinin değerinin anakütle değerine yaklaşması ve n=N olmasıdurumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık”denir.
nlim P 1
,’nın tutarlı tahmincisidir.
19
Tahminleyicilerin Özellikleri
3. Etkinlik
A
B
X
)X(P
Birden fazla sapmasız ve tutarlı tahminci olması
durumunda, bir tahmincinin varyansının, aynı
anakütle parametresinin başka bir tahmincisinin
varyansından daha küçük olması durumunda elde
edilen tahmincilere “etkin” tahminci adı verilmektedir.
Etkin Tahminci
Örnek hacmi büyüdükçe tahminleyicinin varyansı küçülür.
X
P(X)
A
BKüçük
örnek
hacimli
durum
Büyük
örnek
hacimli
durum
ÖRNEKLEME DAĞILIMI ÖRNEK
HACMİNİN BİR FONKSİYONUDUR
20
• Örnek 2 verileri için aritmetik ortalama ve
örnek medyanının tahminleyici özelliklerini
araştırınız.
21
Örnek 3
Örnek 3
22
Aritmetik ortalama , anakütle ortalamasının sapmasız
bir tahminleyicisi midir?
x
x 0 3 12
P(x) 1/3 1/3 1/3
1
( )N
i ii
E x x P x
1 1 10 3 12
3 3 3
5
Örnek 3
23
0 1 2 3 4 5 6 8 9 12
P( ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
xx
1
( )N
x i ii
E x x P x
1 3 10 1 12
27 27 27
5
Örnek 3
24
Sonuç:
E x
olduğundan aritmetik ortalama (tahminleyici), anakütle
ortalamasının (parametrenin) sapmasız bir tahminleyicisidir.
Örnek 3
25
Örnek medyanı m, anakütle ortalamasının sapmasız
bir tahminleyicisi midir?
m 0 3 12
P(m) 7/27 13/27 7/27
7 13 7
0 3 1227 27 27
i ii
E m m P m
4.56
E m
Örnek 3
26
Sonuç:
olduğundan örnek medyanı (tahminleyici), anakütle
ortalamasının (parametrenin) sapmalı bir tahminleyicisidir.
E m
Örnek 3
27
• Aritmetik ortalama , anakütle ortalamasının Minimum
Varyanslı bir tahminleyicisi midir?
x
x 0 3 12
P(x) 1/3 1/3 1/3
x2 0 9 144
x2P(x) 0 9/3 144/3
2 2 153( )
3i iE x x P x
22 2
x V x E x E x
21535
3
26
Örnek 3
28
Aritmetik ortalamanın varyansı 2
x
0 1 2 3 4 5 6 8 9 12
P( ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
0 1 4 9 16 25 36 64 81 144
P( ) 0 3/27 12/27 9/27 48/27 150/27 108/27 192/27 243/27 144/27
ix
2
ix
ix
2
ixix
2 2 909
27i iE x x P x
22( ) ( )V x E x E x
2909(5)
27
= 8,66
Örnek 3
29
mi 0 3 12
P(mi) 7/27 13/27 7/27
0 9 144
P(mi) 0 117/27 1008/27
Örnek medyanının varyansı 2
m
2
im2
im
2 2 41.66i iE m m P m
22( ) ( )V m E m E m
241.66 (4.56)
=20.86
Örnek 3
30
Sonuç:
Aritmetik ortalama , anakütle ortalamasının Sapmasız ve
Minimum Varyanslı bir tahminleyicisidir.
V x V m
x
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
31
BEKLENEN DEĞER OPERATÖRÜ E(.)
• Şans değişkeni x anakütle ortalaması ve
anakütle varyansı 2 olsun.
• a ile b birer sabit sayı olmak üzere,
E(a)=a
E(ax)=aE(x)=a
E(ax+b)=aE(x)+b=a+b
32
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
VARYANS OPERATÖRÜ V(.)
• Şans değişkeni x anakütle ortalaması ve
anakütle varyansı 2 olsun.
• a ile b birer sabit sayı olmak üzere,
V(a)=0
V(ax)=a2V(x)= a22
V(ax+b)= a2V(x)= a22
MERKEZİ LİMİT TEOREMİ
33
• Şans değişkeni x’in dağılımı ne olursa olsun bu
anakütleden alınan n hacimli örneklerden
hesaplanan aritmetik ortalamanın dağılımı
yaklaşık olarak normal dağılıma sahiptir.
x
x• Örnek hacmi büyüdükçe aritmetik ortalamanın
dağılımının normal dağılıma yakınsaması artar.
Şans Değişkenlerinin
Standartlaştırılması
• Standart değişkenler genellikle z ile gösterilir.
• Ortalaması sıfır, E(z)=0
• Varyansı bir, V(Z)=1.
şans değişkeni-anakütle ortalaması
anakütle standart sapmasız
34
35
BAZI ÖNEMLİ TAHMİNLEYİCİLER İÇİN ÖRNEKLEME
DAĞILIMLARININ BELİRLENMESİ
• Aritmetik ortalama
• Örnek varyansı s2
• Örnek oranı p
x
BİR DAĞILIMIN BELİRLENMESİ
• Dağılışın tipinin belirlenmesi,
(Normal, Üstel, Poisson vb.)
• Dağılımın parametrelerinin belirlenmesi
36
37
ARİTMETİK ORTALAMA İÇİN
ÖRNEKLEME DAĞILIMI
x
Şans değişkeni x anakütle ortalaması ve anakütle varyansı
2 olsun.
1 1 2
n
ii nx x x x
xn n
?E x
?V x
Cevaplanması gereken sorular
• Dağılımın tipi?
• Parametreleri;
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre aritmetik
ortalamanın dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
38
Dağılımın Parametreleri: Aritmetik Ortalama
için Anakütle Ortalaması
39
11
1n
iin
xE x E E x E x
n n
1 n
E xn n
E x
Dağılımın Parametreleri: Aritmetik Ortalama
için Anakütle Varyansı
40
112
1n
iin
xV x V V x V x
n n
2
2 2
2 2
1 nV x
n n
2
V xn
2
2~ ; ; xx x xx N N
n
41
ARİTMETİK ORTALAMA İÇİN ÖRNEKLEME
DAĞILIMI
x
Aritmetik Ortalamanın Standartlaştırılması
42
- x
x
xz
- x
x
xz
n
43
Normal populasyondan örnekleme
• Merkezi eğilim
• Yayılım
– yerine koyarak
örnekleme
Populasyon dağılımı
Örnekleme dağılımı
n =16X = 2.5
n = 4X = 5
= 10
X
nX
X
50X
50 X
X
Merkezi Limit Teoremi
xn
x
Örnek
hacmi
yeterince
büyükse
(n 30) ...Örnekleme
dağılışı
hemen hemen
normal olur.
44
45
Alıştırma
• Türk Telekom’da çalışan bir operatörsünüz. Uzun
mesafeli telefon görüşmeleri = 8 dk. & = 2 dk. ile
normal dağılmaktadır. Eğer 25’lik örnekler seçerseniz
örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında
olacaktır?
46
Çözüm
Örnekleme
dağılımı
.3830
.1915.1915
Standart normal
dağılım
ZX
n
ZX
n
7 8 8
2 2550
8 2 8
2 2550
..
..
8
X
= .4
7.8 8.2 0
Z= 1
-.50 Z.50X
47
ÖRNEK ORANI: p
• Anakütle başarı olasılığını “P” ’yi tahminlemek amacıyla
populasyondan alınan örnekten elde edilen bilgiler
doğrultusunda örnek oranı p hesaplanır.
• İlgilenilen başarı olasılığının P’nin bilinmediği durumlarda n
hacimlik örnek alındığında ve x örnekteki başarı sayısı olarak
ele alındığında, örnekten elde edilen başarı olasılığı (örnek
oranı);
xp
n
48
ÖRNEK ORANI p İÇİN ÖRNEKLEME DAĞILIMI
~B ;x n p
xp
n
?p E p
2 ?p V p
Örnek oranı:
Cevaplanması gereken sorular
• Dağılımın tipi?
• Parametreleri;
Şans değişkeni x sabit n hacimli denemede ortaya çıkan
başarı sayısı olsun.
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre örnek oranının
dağılımı eğer n örnek hacmi yeterince büyük ise
yaklaşık olarak normal dağılıma sahiptir.
• Bunun temel sebebi örnek oranının, n adet
denemede ortaya çıkan ortalama başarı sayısını
temsil etmesidir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
49
Dağılımın Parametreleri: Örnek Oranı için
Anakütle Ortalaması
50
1x
E p E E xn n
np
E pn
E p p
Not: x şans değişkeni binom dağılımına sahip olduğundan:
E(x)=nP
E(x)=nP
Dağılımın Parametreleri: Örnek Oranı için
Anakütle Varyansı
51
2
1xV p V V x
n n
2
1
np pV p
n
1
p p
V pn
Not: x şans değişkeni binom dağılımına sahip olduğundan:
V(x)=np(1-p)
V(x)=nP(1-P)
21
~ ; ;
p p
p pp N N p
n
52
ÖRNEK ORANI p İÇİN ÖRNEKLEME
DAĞILIMI
Örnek Oranının Standartlaştırılması
53
- p
p
pz
-
1
P pz
p p n
Örnek Hacminin Örnek Oranı
Üzerindeki Etkisi
54
Anakütle oranı P sabitken örnek hacmi arttığında örnek
oranının standart hatası küçülür.
Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında p’in
kendi ortalaması etrafında yoğunlaştığı görülmektedir.
( )f p
.72 .88 .92.84.80.76.68
n=400
n=100
p
55
Örnek 4
pi 0/3 1/3 2/3 3/3
0/9 1/9 4/9 9/9
P(pi) 8/27 12/27 6/27 1/27
2
ip
( ) i i
i
E p p P p
( ) pE p p
8 0 12 1 6 2 1 3( ) 0.33
27 3 27 3 27 3 27 3E p
Büyük bir populasyondan alınan 3 ölçüm ile ilgili örneğe
dönersek x başarı sayısının örnekte tek sayı gelme olayını
göstermek üzere örnek oranının beklenen değerini ve
varyansını bularak dağılımını elde ediniz.
Örnek 4
56
2 1
p
p pV p
n
2 (1 ) 0.33(1 0.33)0.074
3
p
p p
n
22 2( ) ( )p E p E p
2 2( ) i i
i
E p p P p
2 8 0 12 1 6 4 1 9( ) 0.185
27 9 27 9 27 9 27 9E p
22 2 2( ) ( ) 0.185 (0.33) 0.074p E p E p
I. YÖNTEM
II. YÖNTEM
Örnek 5
57
• Gelirler Genel Müdürlüğü’ne göre, bütün vergi
beyannamelerinin % 75’i vergi iadesine yol açmaktadır.
100 beyannamelik bir rassal örneklem alınmıştır.
a) Vergi iadesine yol açan beyannamelerin örneklem
oranının ortalaması kaçtır?
b) Örneklem oranının varyansı kaçtır?
c) Örneklem oranının standart hatası kaçtır?
d) Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?
Örnek 5
58
( ) 0,75 E p p
2 (1 )p
p p
n
2 0,75(1 0,75)0,001875
100p
2 0,001875 0,0433p p
Çözüm:
a)
b)
c) Standart Sapma (ya da Standart Hata)
Örnek 5
59
( 0,8) ?P p
0,8( 0,8) ( )
0,8 0,75 0,8 0,75( ) ( )
0,0433 0,0433
( 1,15) 0,5 0,3749 0,1251
p p
P p pP p P
P z P z
P z
d)
2 0,001875 0,0433p p
n = örnek miktarı
s 2 = örnek varyansı
2 = anakütle varyansı
df = serbestlik derecesi = n – 1=v
Ki-Kare Dağılışı
=2
(n - 1) s 22
v
60
Ki-Kare Dağılışı
61
• Ki-kare dağılımının tek bir parametresi vardır: v
• Bu parametre genel olarak serbestlik derecesi olarak
adlandırılır.
• şeklinde gösterilir.
• Ki-kare dağılımı normal (standart normal) dağılıma sahip
şans değişkenlerinden elde edilir.
2
v
Ki-Kare Dağılışı
62
2
2
1
ix xs
n
221 in s x x
22
2
12 2
1 i
n
x xn s
Şans değişkenleri xi‘ler normal dağılıma sahip olmak üzere,
örnek varyansı:
Eşitliğin her iki tarafı anakütle varyansına bölünerek
Ki-Kare Dağılışı
63
2
vE v
2 2vV v
Ki-kare şans değişkeninin beklenen değeri:
Ki-kare şans değişkeninin varyansı:
2
vE v
2 2vV v
2
vE v
2 2vV v
Ki-kare istatistiğinin dağılışının
özellikleri
1. ki-kare dağılışı simetrik değildir
2. Serbestlik derecesi arttıkça, dağılış daha simetrikhale gelir (normale yaklaşır).
0 5 10 15 20 25 30 35 40 45
df = 10
df = 20
Tüm değerler sıfır veya pozitif
Simetrik değil
x2
0
64
Anakütle ortalaması x ve anakütle varyansı 2
x olan bilinmeyen bir
populasyondan x1, x2,…, xn ile gösterilen n adet rassal bir örnek
alındığında populasyon varyansı aşağıdaki gibi bir beklenen değer
ifadesine eşittir:
2 2( )x i xE x
Populasyon ortalaması x bilinmediğinde yerine x konularak örnek
varyansı aşağıdaki gibi tanımlanır.
2 2
1
1( )
1
n
x i
i
s x xn
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
65
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
Varyansı 2
x olan bir populasyondan alınan n hacimlik bir
örneğin örnek varyansı 2
xs olarak ifade edildiğinde;
2
2
12
1 x
n
n s
2 22 1
1
x nxs
n
66
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
2
xs ’nin örnekleme dağılımının ortalaması 2
x ’dir. Her iki
tarafın beklenen değeri alındığında
2 2 212
1
1 1
x n x
x
E nE s
n n
2 2( )x xE s
67
ÖRNEK VARYANSININ ÖRNEKLEME
DAĞILIMI
2
xs ’nin örnekleme dağılımının varyansı,
örnekleme dağılımın Ki-Kare dağılımına uygun olduğunu sonucundan hareketle ;
4 22 212 1
21 1
x nx nx
VV s V
n n
4
2
2
2 1
1
x
x
nV s
n
42 2
1
xxV s
n
68
2
vE v
2 2vV v
69
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.
1 2
2 2
1 2
X X
1 2n n
1 2 1 2
2 2
1 2
1 2
X XZ
n n
70
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,
1 2
2 2 2 2
1 2 1 2
X X
1 2 1 2
2 2
s s
n n n n
(0.04) (0.05) =
100 120
= 0.006
71
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.
1 2
1 1 2 2
P P
1 2
P 1 P P 1 P
n n
1 2 1 2
1 1 2 2
1 2
p p P PZ
P 1 P P 1 P
n n
72
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadakikusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birincifabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnektekikusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarakgözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
1 2
1 2
1 2
1 1 2 2
P P
1 2
P P
P P
P 1 P P 1 P
n n
0.08 0.92 0.05 0.95
100 150
0.0324
73
İstatistiksel Tahminleme
Nokta Tahmini Aralık Tahmini
Pp
σs
μ
X
.035P0.25
3.4σ2.5
60μ20
2
Populasyon parametresinin
tek bir tahmin değerini verir
Populasyon parametresinin
tahmin aralığını verir. Nokta
tahmini kullanılarak
hesaplanır.
74
Örneğin yeterince büyük olmaması veya bir örnekten elde
edilen istatistiğin bir başka örnekten sağlanan istatistikle
aynı olmayışı yüzünden anakütle parametresini bir noktada
tahmin etmek yanlış sonuçlar doğurabilir.
Bu yüzden anakütle parametresi belirli bir hata seviyesi
göz önüne alınarak belirli bir aralıkta aranır. Hata terimini a
ile gösterirsek, 1- a güven seviyesinde aralık tahmini
yapabiliriz.
Hata terimi normal eğrinin her iki ucunda eşit olarak yer alır.
75
Bu a/2 lik hata terimine karşılık gelen ± Z değerleri
belirlenerek örnek dağılımının standart hatası ile
çarpıldığında hata payı elde edilir.
Hata payının örnek istatistiğine eklenip çıkarılması ile aralık
tahmini yapılır. Bu şekilde, anakütle parametresinin belirli
aralıkta yer aldığını, 1-a güven seviyesinde söyleyebiliriz.
Güven sınırlarından küçük olanına alt güven sınırı, büyüğüne
ise üst güven sınırı denir.
Hata terimi küçüldükçe güven aralığı genişler. Güven
sınırlarının belirleneceği olasılık seviyesine göre Z değeri
değişir.
7676
Güven Aralığı Tahmininin Elemanları
Güven aralığıÖrnek istatistiği
Alt güven sınırı Üst güven sınırı
Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı
Güven Aralığı Tahmini
Bir değer aralığı verir.
Populasyon parametresine yakınlık hakkında bilgi verir.
Olasılık terimleriyle ifade edilir.
77
Güven Aralığı Tahminleri
Ortalama
Güven Aralıkları
Oran
bilinmiyor biliniyor
Varyans
n<30n30
t dağılımıZ dağılımı
Z dağılımı2 , F
78
ORTALAMALAR İÇİN GÜVEN ARALIĞI
Bir örnekden elde edilen istatistiği anakütle ortalaması
x in nokta tahminidir.
Gerçek anakütle ortalaması, 1-a güven seviyesinde
X
X X2 X 2P X z X z 1
n na a
a
aralığında yer alır.
79
Güven aralığı
Örneklerin 90%
Örneklerin 95%
Örneklerin 99%
x_
X Z X ZnX
X2.58 1.645 1.645 2.58X X X X
X X X X
1.96 1.96X XX X
80
Aralıklar ve güven seviyesi
Ortalamanın
örnekleme
dağılımı
Çok sayıda aralık
aralık Aralıkların
%(1 - a) ‘ı
’yü kapsar.
%a ‘sı
kapsamaz.
x
=
1 -a a/2a/2
X
_
x_
uzanirkadaraX
ZX
danX
ZX
'
'
81
• Bilinmeyen populasyon parametresinin
aralık içine düşme olasılığıdır.
• %(1 - a güven seviyesi
a : Parametrenin aralık içinde olmaması
olasılığıdır.
• Tipik değerler %99, %95, %90
Güven Seviyesi
82
%95 güven sınırları belirlenirken a hatası 1-0.95=0.05 dir. Bu
hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında
a /2 =0.05/2=0.025 dir.
Bu alanları belirleyen biri negatif, diğeri pozitif iki Z değeri
vardır.
Normal eğri alanları tablosunda
0.50-0.025=0.4750 değerini gösteren Z= ±1.96 değerleri
aradığımız Z değerleridir.
83
%99 güven sınırları belirlenirken
a hatası 1-0.99=0.01 dir.
Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında
a/2=0.01/2=0.005 bulunur.
Normal eğri alanları tablosunda
0.5-0.005=0.4950 değerini gösteren Z= ±2.58 değerleri aradığımız
Z değerleridir.
84
Aralık genişliğini etkileyen faktörler
• Verilerin yayılımı (
• Örnek hacmi
• Güven seviyesi (1 - a)
Aralık
uzanir.ya'
dan'X
ZXX
ZX
x
xn
85
Örnek: Bir fabrikada üretilen 100 ürünün ortalama ağırlığı
1040 gr standart sapması 25 gr bulunmuştur. Bu imalat
prosesinde üretilen ürünlerin ortalama ağırlığı %95 güvenle
hangi aralıktadır?
Z = 0 z=1.96
a/2=0.05/2=0.025
%95 için z değeri ± 1.96 0.475
z=-1.96
86
X X2 X 2P X z X z 1
n na a
a
X
25 25P 1040 1.96 1040 1.96 0.95
100 100
XP 1035.1 1044.9 0.95
87
Örnek
n = 25 hacimli bir şans örneğinin ortalamasıX = 50 dir.
Populasyonun standart sapmasının X = 10 olduğu
bilindiğine göre X için 95%’lik güven aralığını oluşturunuz.
92.5308.46
251096.150
251096.150
x x
α/2 α/2P(X Z μ X Z ) 1 αn n
P( )=0.95
P( )=0.95
88
Populasyonun standart sapması X bilinmediğinde
ve n 30 olduğunda ortalama için güven aralığı
1. Varsayımlar:
Popülasyonun standart sapması bilinmiyor
Populasyon normal dağılımlı.
2. Merkezi limit teoremi kullanılarak Z Dağılımı
kullanılır.
3. Güven aralığı tahmini:
Örneğin standart sapması
x xα/2 α/2
S SP X Z μ X Z 1 α
n n
89
Örnek
•Bir ampul şirketi yeni bir ampul geliştirerek piyasaya sürüyor.
Üretim bandından 100 tanesi rassal olarak seçiliyor ve
bunların standart sapması 140 saat, kulanım süreleri de
ortalama olarak 1280 saat bulunuyor. a=0.05 için populasyon
ortalamasının güven aralığını bulunuz.
140 140Pr 1280 1.96 1280 1.96 0.95
100 100
95.0)44.130756.1252(P
α1)n
SZXμ
n
SZXP( x
α/2x
α/2
Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95olasılıkla 1252.56 ile 1307.44 saat arasındadır.
90
Student t Dağılımı
• Küçük örneklerden (n<30) elde edilen
istatistiklerin dağılımı Student t dağılımına uyar.
• Küçük örnek istatistiklerinin gösterdiği dağılım
normal eğri gibi simetriktir.Normal eğriye göre
daha basık ve yaygın bir şekil alır. Böylece eğrinin
kuyruklarında daha büyük bir alan oluşur.
• Küçük örnekler için z cetveli yerine,çeşitli örnek
büyüklükleri ve olasılık seviyeleri için ayrı ayrı
hesaplanmış t cetvelleri kullanılır.
91
z
t
0
t (sd = 5)
Standart
Normal
t (sd = 13)
Çan şekilli
simetrik,
‘Tombul’
kuyruklar
92
Üst kuyruk alanı
sd .25 .10 .05
1 1.000 3.078 6.314
2 0.817 1.886 2.920
3 0.765 1.638 2.353
t0
Student t Tablosu
n = 3
sd = n - 1 = 2
a = .10
a/2 =.05
Olsun:
2.920t değerleri
.05
93
Populasyonun standart sapması X bilinmediğinde
ve n< 30 olduğunda ortalama için güven aralığı
1. Varsayımlar:
Popülasyonun standart sapması bilinmiyor
Populasyon normal dağılımlıdır.
2. Student’ın t Dağılımı kullanılır.
3. Güven aralığı tahmini:
Örneğin standart sapması
x x
v;α/2 v;α/2
s sPr X t X t 1
n n
a
1v n
Serbestlik derecesi
94
ORTALAMA İÇİN GÜVEN ARALIĞI
Populasyonun standart sapması X bilinmediğinde ve
populasyonun normal dağıldığı varsayımı altında güven aralığı
tahmini:
/2a /2aa1 -
2, 1nxs
X tn
a 2, 1nxs
X tn
a
2at 2at
x x
v;α/2 v;α/2
s sPr X t X t 1
n n
a
1v n
95
ÖRNEK
•Bir fabrikada rasgele üretilen 25 ürünün ortalama ağırlığı
1040 gr standart sapması 25 gr bulunmuştur. %95 güvenle
bu imalat prosesinde üretilen ürünlerin ortalama ağırlığı hangi
aralıkta yer alır?
25 251040 2.064 1040 2.064
25 25
1029.68 1050.32
x x
v;α/2 v;α/2
s sX t X t
n n
96
Bir Oranın Güven Aralığı
1. Varsayımları
– İki kategorik çıktı vardır.
– Populasyon binom dağılımı gösterir.
2. Güven aralığı tahmini:
α/2 p α/2 pP(p Z .S P p Z .S ) 1 α
.p
p qS
n
xp
n
Örnek
hacmi
Özellikli
birim sayısı
Örnek oranı p anakütle oranı P nin nokta tahminidir.
97
•400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite
sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma
oranı için %95’lik güven aralığını bulunuz.
α/2 p α/2 pPr p Z .S p Z .S 1 αP
320.08
400p
ÖRNEK:
0.08 1 0.08 0.08 1 0.08Pr 0.08 1.96 P 0.08 1.96 0.95
400 400
Pr 0.053 P 0.107 0.95
98
İki Ortalamanın Farkı İçin Güven Aralığı
Örnek ortalamalarından büyük olan ile gösterilirse örnek
ortalamaları arasındaki farktan hareketle anakütle ortalamaları
arasındaki farkın güven sınırları aşağıdaki gibi olur.
1X
Populasyon Varyansları Biliniyorsa:
a
aa
1
nnZXX
nnZXXP
2
22
1
21
2/2121
2
22
1
21
2/21
α1n
S
n
SZXXμμ
n
S
n
SZXXP
2
22
1
21
α/2,2121
2
22
1
21
α/2,21
Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda:
99
Örnek
Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B
sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun
başlangıcından 6 hafta sonra her iki sınıfa da aynı test
uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal
olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama
başarı notu 86 ve standart sapması 12, B sınıfından rassal
olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve
standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama
başarı notları arasındaki farkın güven aralığını %99 olasılıkla
belirleyiniz.
100
1 1 1
2 2 2
X 86 S 12 n 40
X 72 S 14 n 35
2 2 2 2
1 2 1 21 2 α/2 1 2 1 2 α/2
1 2 1 2
S S S SPr X X μ μ X X 1 α
n n n nZ Z
2 2 2 2
1 2
12 14 12 14Pr 86 72 2.58 μ μ 86 72 2.58 0.99
40 35 40 35
1 2Pr 6.18 μ μ 21.82 0.99
Örnek
101
Örnekİki anakütleden tesadüfi olarak seçilen n1 ve n2 hacimlerindeki
iki küçük örnekten hareketle anakütle ortalamaları arasındaki
farkın güven sınırları belirlenebilir. Birinci örneğin serbestlik
derecesi n1 -1 ve ikinci örneğin serbestlik derecesi n2 – 1 dir ve
toplam serbestlik derecesi
Anakütle ortalamaları arasındaki farkın güven aralığı
belirlenirken serbestlik derecesine
ve hata payına göre t tablo değerleri bulunur.
221 nnv
2a
221 nnv olur.
1 2 1 2
2 2
1 2 α/2,n n 2 1 2 1 2 α/2,n n 2
21 21
1 1 1 1Pr X X t μ μ X X t 1 αp ps s
n n n n
2 2
1 2
1
2 1
2
2( 1) ( 1)
2p
n s n ss
n n
Ana kütle varyanslarının eşit dağıldığı
varsayımı ile değerine
havuzlanmış(pooled) varyans denir.
𝑠𝑝2
102
ÖRNEK
13 deneme sonrasında bir benzin pompası ortalama 125 ml
fazla benzin ölçümü yaparken standart sapma 17 ml
olmuştur.Bir başka benzin pompası ise 10 deneme
sonrasında deneme başına ortalama 110 ml fazla benzin
ölçümü yapılmış ve standart sapması 19 ml bulunmuştur.
Anakütle ortalamaları arasındaki farkın %99 güven sınırlarını
bulunuz. 2121013 v 831.2tabt
1 22,91 32,92
Pompaların fazla ölçümleri arasındaki fark %99 güvenle -2.91 ml
ile 32.92 ml arasındadır.
1 2 1 2
2 2
1 2 α/2,n n 2 1 2 1 2 α/2,n n 2
21 21
1 1 1 1Pr X X t μ μ X X t 1 αp ps s
n n n n
2 2
1 2
1 2
2 22 1 2( 1) ( 1) (13 1)17 (10 1)19
319,862 13 10 2
p
n s n ss
n n
1 1(125 110) 2,381. 319,86
13 10
103
İki Oran Farkının Güven Aralığı
1. Varsayımları
İki kategorik çıktı vardır.
Populasyonlar binom dağılımı gösterir.
2. Güven aralığı tahmini:
1 2 1 21 2 α/2 p p 1 2 1 2 α/2 p pPr p p Z S P P p p Z S 1 a
İki oran farkının
standart sapması1 2
1 1 2 2
1 2
. .p p
p q p qS
n n
Örnek oranlarından büyük olan p1 ile gösterilirse örnek oranları
arasındaki farktan hareketle anakütle oranları arasındaki farkın
güven sınırları aşağıdaki gibi olur.
104
İki Oran Farkının Güven Aralığına Örnek
İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup
olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet
hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B
ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği
gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının
farkının %95’lik güven aralığını bulunuz.
n1 = 1000, n2 = 1000 1 2
825 7600.825 0.760
1000 1000p p
1 2
1 1 2 2
1 2
. . 0.825.(1 0.825) 0.760.(1 0.760)
1000 1000
0.018
p p
p q p qS
n n
105
95.0018.096.1760.082.0PP018.096.1760.082.0Pr 21
1 21 2ˆ ˆ1 2 α/2 1 2 1 2 α/2 p pp pPr p p Z S P P p p Z S 1 a
95.010.0PP029.0Pr 21
106
Eşleştirilmiş Örnek t Testi
1. İki ilişkili populasyonun ortalamasını test eder.
– Çift ya da eşleştirilmiş
– Tekrarlı gözlemler (önce/sonra)
2. Nesneler arasındaki varyasyonu ortadan kaldırır.
Varsayımları
– İki populasyon da normal dağılımlıdır.
– Eğer normal değilse normale yaklaşmaktadır.
(n1 30 & n2 30 )
Aynı veya benzer denekler üzerinde birbirinden farklı iki işlemin
uygulanması sonucu elde edilen verilere eşleştirilmiş örnekler
denir.
107
İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir. İddiayı test
etmek için 12 ev seçiliyor ve komisyonculardan bu evlere 1000$ bazında fiyat
vermeleri isteniyor. Elde edilen sonuçlar aşağıdaki gibidir.İki komisyoncunun fiyat
ortalamaları arasındaki farka ilişkin güven aralığını hesaplayınız.
Eşleştirilmiş Örnek t Testi
Komisyoncular
Evler A B D D2
1 181.0 182.0 -1.0 1.00
2 179.9 180.0 -0.1 0.01
3 163.0 161.5 1.5 2.25
4 218.0 215.0 3.0 9.00
5 213.0 216.5 -3.5 12.25
6 175.0 175.0 0.0 0.00
7 217.9 219.5 -1.6 2.56
8 151.0 150.0 1.0 1.00
9 164.9 165.5 -0.6 0.36
10 192.5 195.0 -2.5 6.25
11 225.0 222.7 2.3 5.29
12 177.5 178.0 -0.5 0.25
Toplam -2.0 40.22
108
D 2D 0.167
n 12
2 2
2
D
D 2D 40.22
n 12s 1.904n 1 12 1
ttab : t11,0.05 = ± 2.2011 12 1 11 . .v n s d
, 1 , 12 2
D D Dn nD t s D t sa a
)904.1(201.2167.0)904.1(201.2167.0 D
023.4357.4 D
BİR POPULASYON VARYANSI İÇİN GÜVEN
ARALIKLARI
Bir anakütle varyansı için de güven aralığı bulmak gerekir.
Bu tahminler örneklem varyansına dayanır.
Varyansı olan bir normal anakütleden n gözlemli rassal
bir örneklem seçilsin. Örneklem varyansı da s2 ile gösterilsin.
2
22
1 2
( 1) xn
n S
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
2xs
2 2
2
2 2
, 1 1 , 12 2
1 11
n n
n S n SP
a a
a
anan
Red BölgesiRed
Bölgesi1-a
Örneğin a=0.05 n=10 olsun
2
0.975;9 2
0.025;9
111
Örnek
Bir çimento fabrikasında üretilen çimentodan yapılan betonların
sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve
bu örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin
ortalama ve varyansı olarak bulunmuştur.
Fabrikanın ürettiği tüm betonların varyansına ilişkin güven
aralığını hesaplayınız.
2312 195x s
1 0.90a
a n
an
Red BölgesiRed
Bölgesi
2
0.95;9 3.33 2
0.05;9 16.92
a=0.10
112
1 0.90a
2 2
2
2 2
, 1 1 , 12 2
1 11
n n
n s n sP
a a
a
2
2 2
0.05;9 0.95;9
9 195 9 1950.90P
29 195 9 1950.90
16.92 3.33P
2103.72 527.02 0.90P
3.33 16.92
103.72 527.02S
2
an
1-a
2312 195x s 0.10a
ÖRNEK
Denenen bir motorun 16 deneme sürüşündeki yakıt
tüketimlerinin standart sapması 2.2 golondur. Motorun yakıt
tüketiminin gerçek değişkenliğini ölçen anakütle varyansının
% 99 güven aralığını hesaplayınız. n=16 s=2.2
an
an
Red BölgesiRed
Bölgesi
a
aa
1)1()1(
2
1,2
1
22
2
1,2
2
nn
snsnP
01.0a
2 20.005,15
, 12
32.80n
a
2 20.995,15
1 , 12
4.60n
a
2 22
2 2
, 1 1 , 12 2
( 1) ( 1)1
n n
n s n sP
a a
a
99.060.4
)2.2(15
80.32
)2.2(15 22
2
P
99.078.1521.2 2 P
n=16 s=2.2