İSTATİSTİK (STATİSTİCS) NEDİR?

95
İSTATİSTİK (STATİSTİCS) NEDİR? Herhangi bir konuyu incelemek için gerekli verilerin toplanması, toplanan verilerin değerlendirilmesi ve bilgi haline dönüşmesini sağlayan bilim dalıdır. İstatistik, tüm evreni (populasyonu) incelemek yerine evrenden seçilen örneği inceleyerek evren hakkında tahminde bulunmayı sağlamaktadır. Çünkü tüm evreni incelemek maddi olarak çok zor olduğu gibi, büyük zaman kayıplarına da neden olmaktadır. O nedenle örnekleme yapılarak, para- zaman- araç-gereç ve personelden tasarruf sağlanmış olur. Ayrıca uzun yıllar gerektiren bir çalışmada örnek yerine tüm evrene ait verilerin toplanması yoluna gidilirse, yıllar sonra toplanmış olan verilerin 1

description

İSTATİSTİK (STATİSTİCS) NEDİR?. Herhangi bir konuyu incelemek için gerekli verilerin toplanması, toplanan verilerin değerlendirilmesi ve bilgi haline dönüşmesini sağlayan bilim dalıdır. - PowerPoint PPT Presentation

Transcript of İSTATİSTİK (STATİSTİCS) NEDİR?

Page 1: İSTATİSTİK (STATİSTİCS) NEDİR?

İSTATİSTİK (STATİSTİCS) NEDİR?

Herhangi bir konuyu incelemek için gerekli verilerin toplanması,

toplanan verilerin değerlendirilmesi ve bilgi haline dönüşmesini sağlayan

bilim dalıdır.

İstatistik, tüm evreni (populasyonu) incelemek yerine evrenden

seçilen örneği inceleyerek evren hakkında tahminde bulunmayı

sağlamaktadır. Çünkü tüm evreni incelemek maddi olarak çok zor olduğu

gibi, büyük zaman kayıplarına da neden olmaktadır. O nedenle örnekleme

yapılarak, para- zaman- araç-gereç ve personelden tasarruf sağlanmış

olur.

Ayrıca uzun yıllar gerektiren bir çalışmada örnek yerine tüm

evrene ait verilerin toplanması yoluna gidilirse, yıllar sonra toplanmış olan

verilerin güncelliğini kaybetme riski de ortaya çıkacaktır. Dolayısıyla

yapılan tüm harcama ve geçen zamanın güncel olarak bir değeri

olmayacaktır.

1

Page 2: İSTATİSTİK (STATİSTİCS) NEDİR?

Tanımlayıcı istatistik: Elde edilen verilerin sınıflandırılması, ortalama ve yaygınlık ölçülerinin hesaplanması, tablo ve grafiklerle sunulmasını içerir.

Çıkarımsal istatistik: Örneklemden elde edilen bulgular yardımıyla evren hakkında kestirimde bulunma, hipotezleri test etme ve karara varma gibi konuları içerir.

İstatistik konu olarak tanımlayıcı istatistik ve çıkarımsal istatistik

olmak üzere iki ana gruba ayrılır.

2

Page 3: İSTATİSTİK (STATİSTİCS) NEDİR?

Biyoloji, tıp ve diğer sağlık bilimlerinde araştırma düzeninin oluşturulması, verilerin elde edilmesi ve değerlendirilmesi ile uğraşan

bilim dalıdır.

BİYOİSTATİSTİK

3

Page 4: İSTATİSTİK (STATİSTİCS) NEDİR?

EVREN (=POPULASYON – ANA KÜTLE)

Belirli bir özelliğe sahip bireylerin tümünün oluşturduğu topluluk olarak

tanımlanabilir. Örneğin veteriner fakültesi öğrencileri yada veteriner

fakültesinin 1. sınıf öğrencileri gibi. Evren büyük – küçük; sonsuz – sınırlı

olabilir.

PARAMETRE

Evreni tanımlamak için kullanılan ölçülere parametre denir.

ÖRNEKLEM(E)

Evreni temsil ettiği düşünülen bir grubun oluşturduğu topluluğa Örneklem

denir. Örneklemi seçmek için yapılan işlemlere de Örnekleme denir.

TAM SAYIM

Bir araştırmanın populasyonu oluşturan bütün bireylere uygulanmasıdır.

TANIMLAR

4

Page 5: İSTATİSTİK (STATİSTİCS) NEDİR?

DEĞİŞKEN (VARIABLE)Canlıların ve çevrenin her bir özelliğidir. İncelenen parametre, ölçü, veri veya değerdir. Adından da anlaşılacağı üzere incelenecek olan parametre anlık veya dönemsel olarak değişim göstermektedir. Aynı özelliği gösterenlerin oluşturduğu gruptur. (Ör: cinsiyet, ırk, günlük 20 lt.’nin üzerinde süt veren inekler vs.). Değişkenler kantitatif (rakamsal =quantitative) olabildiği gibi, kalitatif (grup, kategori, =qualitative) de olabilir. Ör: Türkiye’deki 10 milyon sığırın 2 milyonu(%20) Simental’dir, 3 milyonu (%30) Holstein’dır.

VERİ (DATA)Bir olayı aydınlatmak veya gerçeği ortaya çıkarmak için toplanan rakamlar, sayısal bilgilerdir. İstatistikçilerin üzerinde çalıştığı materyallerdir. Ölçüm, sayım ve gözlem kayıtlarıdır. (Ör: İşletmemizde bulunan ineklerin günlük süt verimleri)

5

Page 6: İSTATİSTİK (STATİSTİCS) NEDİR?

Araştırma Nedir?

6

Page 7: İSTATİSTİK (STATİSTİCS) NEDİR?

Bilinmeyen bir olayı ortaya çıkarmak, bilinenleri geliştirmek, herhangi bir konuyu aydınlatmak,

sorunları ortaya çıkarmak ya da sorunlara çözüm yolları aramak için yapılan planlı ve bilimsel bir çalışmadır.

Araştırma

7

Page 8: İSTATİSTİK (STATİSTİCS) NEDİR?

Araştırmanın uygulanması için araştırma kapsamına giren birimler belirlenmelidir.

Araştırma birimi, araştırma konusuna göre değişir.

Örneğin bir bölgede hane halkı ile ilgili bir araştırma düzenlendiğinde, araştırma birimi

hanelerdir.

Araştırmanın Uygulanması ve Değerlendirilmesi

8

Page 9: İSTATİSTİK (STATİSTİCS) NEDİR?

Araştırma konusunu içeren sorular, araştırma birimlerine uygulanır.

Araştırma sonunda toplanan veriler istatistiksel yöntemler kullanılarak

değerlendirilir.

9

Page 10: İSTATİSTİK (STATİSTİCS) NEDİR?

Araştırmaların Temel Amaç ve Yöntemlerine Göre Sınıflandırılması

I. Gözlemsel Araştırmalar

1. Tanımlayıcı Araştırmalar 2. Analitik Araştırmalar

1- Vaka-Kontrol Araştırmaları2-Kohort Araştırmaları3-Kesitsel Araştırmalar

10

Page 11: İSTATİSTİK (STATİSTİCS) NEDİR?

II. Deneysel Araştırmalar

Deneysel araştırmalar genellikle klinikte ve laboratuvarlarda yapılır.

III. Metodolojik Araştırmalar

11

Page 12: İSTATİSTİK (STATİSTİCS) NEDİR?

ARAŞTIRMALARDA DİKKAT EDİLMESİ GEREKEN NOKTALAR

Araştırmanın konusu ve amacı belirgin, sınırlı ve güncel olmalı,

Araştırıcının yeterli bilgisi olmalı ya da konu ile ilgili uzmanlarla çalışmalı,

Kullanılacak analiz metodu doğru seçilmeli,

Elde edilen sonuçların bilime ya da uygulama alanlarına katkısı olmalı,

Araştırıcının yeterli zamanı, elemanı, techizatı ve maddi kaynağı olmalı,

Çalışacak elemanlar iyi eğitilmeli, personelin istenildiği ve öğretildiği gibi çalışıp çalışmadığı kontrol edilmeli,

Araştırmada kullanılacak özellikler ve ölçüm hassasiyeti önceden belirlenmeli, amaca uygun ölçüler kullanılmalı,

Toplanan bilgiler iyi korunmalıdır. Araştırma devam ederken sık sık değerlendirme yapılmalı ve

Deneklerin uygulamaya olan tepkileri kontrol edilmelidir.12

Page 13: İSTATİSTİK (STATİSTİCS) NEDİR?

Deneme hatasını en aza indirilmesi için;

Homojen materyal seçimi ve alt gruplara homojen dağıtılması için uygun örnekleme metotları kullanılmalı,

Tekrar sayısı veya araştırmada kullanılan denek sayısı artırılmalı,

Araştırma özelliğini etkileyen faktörler mümkün olduğu kadar araştırmaya dahil edilmeli, dahil edilemeyen faktörler ise bütün gruplara eşit uygulanmalı,

Mekan ve çevre faktörlerinden kaynaklanan farklı etkilerin araştırma materyali üzerine homojen dağılması sağlanmalı ve

Zaman faktörünün etkisi de dikkate alınmalıdır.

13

Page 14: İSTATİSTİK (STATİSTİCS) NEDİR?

İncelenen konuya açıklık getirmek amacıyla toplanan bilgiler, belgeler, ölçümler, ... vb.

VERİ

Veri tipleri

1- Ölçümle Belirtilen Sürekli (Nicel) Veriler2- Sayısal Olarak Belirtilen Kesikli Veriler3- Nitelik (İsim) Olarak Belirtilen Veriler

14

Page 15: İSTATİSTİK (STATİSTİCS) NEDİR?

VERİ TİPLERİ1- Ölçümle Belirtilen Sürekli (Nicel) VerilerKandaki kolesterol düzeyi, hayvanların günlük yem tüketimi, yaşı, kilosu gibi. Bu veriler süreklidir ve iki aralıkta değer alabilirler. 120-130 mg/ml veya 10-15 kg/gün gibi. Ölçüm veya tartımla elde edilirler.2- Sayısal Olarak Belirtilen Kesikli VerilerÖlen hayvan sayısı, iyileşen hayvan sayısı, gebe kalma oranı, nüfus gibi. Bu veriler sürekli ve aralıklı değildir. Yani net bir rakamdır. Sayımla elde edilirler.3- Nitelik (İsim) Olarak Belirtilen Verilerİyileşti- iyileşmedi, gebe kaldı- kalmadı şeklinde olabildiği gibi, çok iyi-iyi-az iyi-iyi değil gibi sıralanabilen verilerdir. Erkek-dişi gibi, saç rengi göz rengi gibi nitelik belirten ve rakamla ifade edilmeyen verilerdir. 1 ve 2. tip veriler kantitatif, 3. tip veriler ise kalitatif niteliktedir.

15

Page 16: İSTATİSTİK (STATİSTİCS) NEDİR?

VERİLERİN ELDE EDİLMESİTemel olarak verileri 5 farklı yaklaşımla elde edebiliriz.

1. ARŞİV TARAMASI

2. GÖZLEM YOLUYLA

3. DENEME DÜZENLENEREK

4. ANKET DÜZENLENEREK

5. YAPAY (SİMULASYON) YOLLARLA

16

Page 17: İSTATİSTİK (STATİSTİCS) NEDİR?

Verilerin elde edilmesinde dikkat edilmesi gereken hususlar;

1. Araştırma sonuçlarını etkilemeyecek şekilde, en düşük maliyetle veri

elde etmeye çalışılır.

2. İstatistikte her ne kadar %100 doğruluk payı olmasa da verilerin

doğruluğu ve güvenilirliği çok önemlidir. O nedenle, bizzat araştırıcı

tarafından toplanan verilerin güvenirliği, eski kayıt ve belgelerden

toplanan verilerin güvenirliğinden daha fazla olacaktır. Bilimsel

araştırmalarda genellikle %95 güven aralığı yeterli olarak kabul

edilmektedir.

3. Verilerin en kısa sürede elde edilmesi, sonuçların geçerliliğini

yitirmemesi açısından önemli bir kriterdir.

4. Deneysel olarak elde edilecek veriler dışında veriler genellikle anket

yoluyla toplanmaktadır. O nedenle düzenlenecek olan anket konunun

uzman(lar)ı tarafından hazırlanmalı ve sorular açık, kısa ve mantıklı

olmalıdır.

17

Page 18: İSTATİSTİK (STATİSTİCS) NEDİR?

Verileri Sınıflandırılması, Tablo ve Grafiklerle Gösterilmesi

Veriler elde edildikten sonra bilgi haline dönüştürebilmek ve daha kolay anlaşılmasına yardımcı olmak için sınıflandırılması gerekmektedir. Sınıf sınırı (Alt sınır-üst sınır); örneğin biyometri dersinden 60-70 arası not alanlar denildiğinde alt sınır 60, üst sınır 70’dir.

Sınıf aralığı; ard arda gelen iki sınıfın alt ve üst sınırları arasındaki farktır. Örneğin dersten 10-14 arası alanlarla, 15-19 arası alanlar arasındaki sınıf aralığı 5’dir.

Sınıf sayısı; 50-60 alanlar, 61-70 alanlar, 71-80 alanlar şeklinde sınıflandırma yapıldığında sınıf sayısı 3’tür. Sınıf sayısının 8 ile 15 arasında olması tercih edilir.

18

Page 19: İSTATİSTİK (STATİSTİCS) NEDİR?

Örnek: 20 adet öğrencinin biyometri dersinden aldığı notlar sırasıyla aşağıdaki gibi olsun;

10-12-18-23-24-35-40-44-46-48-55-57-64-70-75-78-81-83-89-90

Dağılım aralığı bulunurken en büyükle en küçük değerin farkı alınır (90-10=80). Bulunan fark önce 8’e (80/8=10) sonra 15’e (80/15=5,3) bölünür. Elde edilen 5,3 ile 10 arasında bir değer sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 8 alırsak (80/8=10) 10 adet sınıfımız olur. 9 olarak alırsak (80/9=8,8) 9 adet sınıfımız olur. Sınıf aralığını 9 olarak aldığımızı kabul edersek;

Sınıflar 10-18; 19-27; 28-36; 37-45; 46-54; 55-63; 64-72; 73-81; 82-90; şeklinde oluşur ve tüm değerler bu sınıfların içerisinde yer alır.19

Page 20: İSTATİSTİK (STATİSTİCS) NEDİR?

Frekans (sıklık); sınıflar tespit edildikten sonra her bir değerin hangi sınıfa gireceğine bakılır.

Sınıf Sayısı Sınıflar Frekans 1 10-18 32 19-27 23 28-36 14 37-45 25 46-54 26 55-63 27 64-72 28 73-81 39 82-90 3

20

Page 21: İSTATİSTİK (STATİSTİCS) NEDİR?

Tablo Nedir? Tablo Düzenlenirken Nelere Dikkat Edilmelidir?

Tablo, verilerin satır ve sütunlar halinde sistemli bir şekilde bir arada sunulmasıdır.

Tablo düzenlerken dikkat edilmesi gereken noktalar;- Her tablonun mutlaka bir başlığı ve sıra numarası olmalıdır. Bu başlık, tablonun içeriğine uygun olmalı ve fazla uzun olmamalıdır.- Tablodaki birimlerin ölçü birimleri verilmelidir. Eğer tablodaki tüm ölçü birimleri aynı ise o zaman bu ölçü birimi tablo başlığının altına yazılabilir.- Tablodaki satır ve sütunların neyi ifade ettiği başta yazılmalıdır. - Tablolar fazla geniş ve uzun olmamalıdır. Gerekirse tablo 2’ye 3’e bölünmelidir.- Tabloda kullanılan kısaltma varsa tablonun altında belirtilmelidir. Tabloda kullanılan veriler başka bir kaynaktan alınmışsa alınan kaynağa atıf yapılmalıdır.- Tabloda kullanılan veriler açık ve tam olarak yazılmalıdır.

21

Page 22: İSTATİSTİK (STATİSTİCS) NEDİR?

TABLO ÇEŞİTLERİ

1. MARJİNAL TABLO: Deneklerin incelenen herhangi bir değişkenin sınıflarına nasıl dağıldığını gösteren tablodur.

Örn: 1. sınıf öğrencilerinin Anatomi, Histoloji, Biyoistatistik dersinden aldıkları not ortalamaları

2. ÇAPRAZ TABLO: İki yada daha çok değişkenin birlikte incelenmesidir.

22

Page 23: İSTATİSTİK (STATİSTİCS) NEDİR?

Örnek: Türkiye ve Avrupa Birliği’nde yıllar itibariyle hayvansal ürünlerde verim miktarlarına ait rakamlar Tablo. 1’de verilmiştir (3, 6, 7, 8, 9, 10).

Üretim Miktarları ve Ortalama Verimlilikler

TÜRKİYE AVRUPA BİRLİĞİ

2001 2002 2003 2001 2002 2003

Sığır Karkas Verimi (kg/baş) 180 185 176 320 316 318

İnek Süt Verimi (kg/baş/yıl) 1.669 1.705 1.699 5.998 6.075 6.235

Koyun Karkas Verimi (kg/ baş)

18 19 16 14 14 14

Koyun Süt Verimi (kg/ baş/yıl) 49 48 61 128 126 126

Tablo 1. Türkiye’de ve AB’de Elde Edilen Verimler (2001-2003)

23

Page 24: İSTATİSTİK (STATİSTİCS) NEDİR?

Grafik Nedir? Grafik Yapımında Nelere Dikkat Edilmelidir?

Grafik, bulguların şekillerle ifade edilerek açık ve kolay anlaşılır bir şekilde okuyucuya sunulmasını sağlayan bir araçtır.

Grafiklerin en önemli özelliği göze hitap etmesidir.

Grafiklerin de tablolar gibi kısa ve açıklayıcı bir başlığı ile numarası olmalı, eksenlerin neyi ifade ettiği belirtilmeli ve kısaltma kullanılmışsa açıklaması yapılmalıdır.

24

Page 25: İSTATİSTİK (STATİSTİCS) NEDİR?

Grafik yapımında dikkat edilmesi gereken noktalar;

- Her grafiğin mutlaka bir başlığı olmalıdır. Bu başlık, grafiğin içeriğine uygun olmalı ve fazla uzun olmamalıdır.

- Eksenlerin neyi ifade ettiği belirtilmelidir.

- Grafikte kullanılan ölçekler ve işaretler hakkında açıklayıcı bilgi konulmalıdır.

- Grafik karışık olmamalıdır.

25

Page 26: İSTATİSTİK (STATİSTİCS) NEDİR?

GRAFİK TÜRLERİ

1- Çubuk Grafik: Frekansların ve yüzdelerin bir çubukla gösterilmesidir. Çubuğun yüksekliği frekansı ve yüzdeyi ifade eder.

02468

101214161820

ilkokul ortaokul lise üniversite

kullanan

kullanmayan

Grafik 2. Süt sağımında eğitim düzeyine göre eldiven kullanım durumu

26

Page 27: İSTATİSTİK (STATİSTİCS) NEDİR?

Grafik 5. Süt sağımında eğitim düzeyine göre eldiven kullanım durumu

0%

20%

40%

60%

80%

100%

ilkokul ortaokul lise üniversite

kullanmayan

kullanan

27

Page 28: İSTATİSTİK (STATİSTİCS) NEDİR?

2- Çizgi Grafik: Genellikle bir değişkenin belirli bir süre içinde gösterdiği değişiklikleri incelemek için çizilen grafik türüdür.

0

500

1000

1500

2000

2500

3000

3500

4000

1 2 3 4 5 6 7 8 9 10 11

sağlam

spekülatif

Grafik 1. İMKB’de İşlem Gören İki Farklı Hisse Senedi Fiyatları

28

Page 29: İSTATİSTİK (STATİSTİCS) NEDİR?

29

3-Daire Grafikleri: Daha çok gelir, harcama, persenol, vb. dağılımlarda başvurulan bir grafik türüdür.

Örn: Hayvancılık İşletmesinde Giderlerin Dağılımı

Yem gideri : %70 360x70/100= 252 derece

İşçilik gideri : %15 360x15/100= 54 derece

Veteriner gideri: %5 360x 5/100= 18 derece

Diğer giderler: %10 360x10/100= 36 derece

Page 30: İSTATİSTİK (STATİSTİCS) NEDİR?

30

Grafik 11. Hayvancılık İşletmesinde Giderlerin Dağılımı

70%

15%

5%

10%

yem

işçilik

veteriner

diğer

Page 31: İSTATİSTİK (STATİSTİCS) NEDİR?

4-HistogramSürekli değişknler için çizilir. Sürekli değişknlerde sınıflar birbirine geçişli olduğu için çubuklar bitişiktir.Veri setinin frekans dağılımıdır.

31

Page 32: İSTATİSTİK (STATİSTİCS) NEDİR?

32

Örnek: Veteriner Fakültesi Çiftliğinde bulunan 80 koyunun yapağı verimleri 1000 gr ile 1800 gr arasında değişsin. 5 koyun 1000-1100 gr, 7 koyun 1101-1200, 10 koyun 1201-1300 gr, 15 koyun 1301-1400 gr, 19 koyun da 1401-1500 gr 10 koyun 1501-1600 gr, 8 koyun 1601-1700 gr ve 4 koyun da 1701-1800 gr yapağı verirse histogramı nasıl çizilir?

Page 33: İSTATİSTİK (STATİSTİCS) NEDİR?

33

5- Dağılım Poligoni: Histogramda çubukların orta noktalarından geçecek şekilde çizgiler çizilirse elde edilecek şekil dağılım poligonu adını alır.

Page 34: İSTATİSTİK (STATİSTİCS) NEDİR?

34

Örnek: Veteriner Fakültesi 1.sınıfta öğrenim gören 65 öğrencinin boy uzunluğunu tahmin edebilmek için seçilen 20 öğrencinin boy uzunluğu

ölçülmüş ve 1.60-1.80 cm arasında olduğu tespit edilmiştir. Evren (Popülasyon)?Örnek sayısı kaçtır?İncelenen değişken nedir?Boy uzunluğu nasıl bir veridir?

Page 35: İSTATİSTİK (STATİSTİCS) NEDİR?

35

FREKANS DAĞILIMLARINI TANIMLAYICI ÖLÇÜTLER

1. YER GÖSTEREN ÖLÇÜTLERa. Merkez ölçütleri: Ortalamalarb. Çeyrek ve yüzdelikler

2. YAYGINLIK ÖLÇÜTLERİa. Standart sapmab. Varyansc. Varyasyon katsayısıd. Standart hata

Page 36: İSTATİSTİK (STATİSTİCS) NEDİR?

ORTALAMALAR

Tanım: Ortalama, sayısal veriler topluluğunun orta noktasını bir kalemde özetleyen veya belirten tipik bir değerdir. Ortalama, merkezde toplanma eğiliminin ölçüsüdür, şeklinde de tanımlanabilir. Ortalama, dağılışları özetleyen tipik bir merkezi eğilim ölçüsüdür.

FAYDALARI

Ortalamalar, seride bulunan bütün değerleri hatırda tutma zahmetinden kurtarır. Bunlar, sayısal veriler topluluğunun kolay bir şekilde anlaşılmasına yardımcı olurlar.

36

Page 37: İSTATİSTİK (STATİSTİCS) NEDİR?

Ortalamalar, rastgele nedenlerin etkilerine daha az maruz kalırlar. Bunlar, olaylardaki normal durumu daha iyi yansıtırlar. Ortalama, normal durumun bir ölçüsü olarak kabul edilir. Örneğin, her hangi bir öğrencinin bilgi düzeyini, tek dersten almış olduğu not değil, okumuş olduğu ve sınavım verdiği tüm derslerden aldığı notların ortalaması gösterir.

Ortalamalar, genel örneğe, alışılmışa, kurala aykırı olan durumların bir ölçüsüdür. Olaylardaki bu anormal durumlar, ortalamalar ile çoğu kez açıklığa kavuşturulur. Örneğin, Van şehir merkezinde, 1984-85 Kış mevsiminde, bir yıl öncesine oranla daha soğuk geçtiğini, 1984-85 yılı Kış aylarında ölçülen sıcaklık dereceleri ortalamasının, 1983-84 Kış mevsimi ısı derecesi ortalaması ile karşılaştırılması sonucu söylenebilir.

Ortalamalar, kıyaslama vasıtalarıdır. Mevcut iki serinin birbirleriyle mukayesesi, ancak, bunların ortalama değerlerinin karşılaştırılması ile mümkündür.

37

Page 38: İSTATİSTİK (STATİSTİCS) NEDİR?

Ortalamaların sakıncaları Sayısal verilerin azlığında ortalamalar her hangi bir anlam taşımaz. Örneğin bir portakal yiyenle hiç portakal yemeyen iki kişiyi, yarım portakal yemiş gibi göstermek oldukça hatalıdır.

Ortalamalar, sayısal bilgiler arasındaki farkları bazen ortadan kaldırabilirler. Örneğin istatistikten 2, Almanca’dan l0 numara almış olan bir öğrencinin not ortalaması 6'dır.

Bu ortalama değer, öğrencinin istatistik ve almanca derslerine karşı yeteneğinin orta olduğunu, oysa bu öğrencinin istatistik dersine karşı yetenekli olmadığı, zayıf olduğu, Almanca’ya karşı ise yetenekli olduğu ve bu yeteneğinin pekiyi dereceyle ifade edildiği görülür.

Ortalamalar, bazen gerçeği tam olarak yansıtmazlar; gerçeğe aykırı bilgi verirler. Örneğin 500 kişilik bir köyde, kişi başına düşen geliri hesaplamak istiyoruz. Bu kişilerin yıllık gelirleri 50 milyon ile 100 milyon arasında olsun ve bu köye yıllık geliri 500 milyon olan başka birisinin taşındığını varsayalım. Bu örnekte, köyün birey nüfusa düşen yıllık gelir ortalaması hesaplanmak istense, bu değerin, köyde yaşayan kişilerin gerçek gelirini yansıtmadığı görülür.

38

Page 39: İSTATİSTİK (STATİSTİCS) NEDİR?

Ortalamaların bu sakıncalarından kaçınmak için, şu noktalara dikkat etmek gerekir:

Ortalama, sayısal verilerin fazla olduğu durumlarda hesaplanır. Çünkü, sayısal verilerin azlığında, ortalama rastgele ortaya çıkan bazı nedenlerin etkisi altında kalabilir ve normal durumu yansıtmayabilir.

Seriyi meydana getiren değerler farklı olmamalıdır. Örneğin Japon ve İngiliz çocuklarının devam ettiği İlkokulun her hangi bir sınıfındaki öğrencilerin boylarının ortalamasını hesaplamak istesek, seriyi oluşturan gruplarda farklılık olduğu, yani, Japon ırkının genelde boylarının kısa, İngilizlerin ise uzun olduğu için, her iki öğrenci grubunu temsil edecek olan ortalama, gerçek değerden ayrı bir noktada olacaktır.

Anormal değerleri ihtiva eden serilerin ortalaması alınmamalıdır; yahut da bu mahsuru ortadan kaldıracak başka metotlar uygulanmalıdır.

39

Page 40: İSTATİSTİK (STATİSTİCS) NEDİR?

Ortalama Türleri: İstatistikte çok değişik ortalama tipleri vardır. Bunlardan en fazla kullanılanları,

Aritmetik Ortalama, Geometrik Ortalama, Harmonik Ortalama, Karesel Ortalama (Kadratik Ortalama), Medyan (Ortanca), Mod (Tepe Noktası)’dur.

40

Page 41: İSTATİSTİK (STATİSTİCS) NEDİR?

ARİTMETİK ORTALAMA

Uzun süreden beri kullanılan, ortalamalar içinde en iyi bilinen ve en yaygın olan bir ortalama çeşididir. Ortalama denildiğinde, genelde akla aritmetik ortalama gelir.

Deneklerin aldıkları değerlerin toplanıp denek saysınına bölünmesi ile elde edilen matematiksel gerçel bir değerdir. Bu nedenle Aşırı dğerlerden etkilenir.

Örnekten hesaplanan aritmetik ortalama, X sembolü ile gösterilir. Hesaplanması kolay ve serinin şekline göre değişir.

41

Page 42: İSTATİSTİK (STATİSTİCS) NEDİR?

l- Aritmetik Ortalamayı Hesaplama Metotları

a) Sınıflandırılmamış verilerde aritmetik ortalamanın hesaplanması

Burada; deneklerin aldıkları değerler (Xı, X2, X3 ......... Xn) tek tek toplanır, bulunan toplam,denek sayısına bölünür. Formül;

42

nX

n

iix

1

Aritmetik ortalama

Denek sayısı

i. Deneğin aldığı değer

n tane deneğin aldıkları değerlerin toplanacağı gösterir

Page 43: İSTATİSTİK (STATİSTİCS) NEDİR?

ÖRNEK: E.Ü. Veteriner Fakültesi birinci sınıf öğrencilerinden rastgele seçilen 20 Öğrencinin 2006 yılında yapılan üniversite giriş sınavında almış oldukları sayısal puanlarının dağılımı aşağıda verilmiştir. Öğrencilerin almış oldukları fen puanlarının aritmetik ortalaması nedir?

Öğrenci Sıra No:

Fen Puanları (X) öğrenci sıra no: Fen Puanları (X)

1 322 11 325

2 315 12 337

3 325 13 324

4 322 14 312

5 314 15 325

6 327 15 315

7 342 17 332

8 327 18 332

9 349 19 317

10 306 20 315

Toplam 6483

6483/20=324,15'dir43

Page 44: İSTATİSTİK (STATİSTİCS) NEDİR?

b) Sınıflanmış verilerde aritmetik ortalamanın hesaplanması

Eğer, sayısal veriler fazla ise, bu değerlerin aritmetik ortalamasını bulmak zorlaşır. Çünkü, sayısal veriler çoğaldıkça, basit bir toplama işlemi bile fazla zaman alır ve hata yapma ihtimali artar. Örneğin 20-30 bin kadar bir gözlemin, sayısal verinin aritmetik ortalamasını yukarıdaki formülün yardımıyla bulmak, hesap makinası ile bile, bir hayli zordur ve de oldukça uzun zaman alır.İşte bu nedenle, fazla sayıdaki verilerin aritmetik ortalamasını bulmak için, veriler, önce bir frekans dağılımı şeklinde gruplandırılır. Bu gruplandırma işlemi tamamlandıktan sonra, ancak gruplandırılmış verilerden aritmetik ortalama hesap edilir.

44

Page 45: İSTATİSTİK (STATİSTİCS) NEDİR?

Hesaplama Metodu

1. Frekansları ile birlikte Sınıflar yazılır, 2. Sınıf değerleri (SD) bulunur ve her sınıfın karşısına yazılır.

Sınıf değeri sınıfın ortalamasıdır. 3. Çalışma birimi “b” kolonu oluşturulur. Yukarı doğru “-”

aşağı doğru “+” olacak şekilde 1 artırarak yazılır.4. Frekansla çalışma birimleri çarpımları (f*b) alınarak her

sınıfın karşısına yazılır. İşaretleri dikkate alınarak toplanır.5. Değerler formüle yerleştirilir.

45

Page 46: İSTATİSTİK (STATİSTİCS) NEDİR?

Formül;

46

xCn

fb

AX

Aritmetik ortalama

Denek sayısı

B kolonunda karşısına 0 konulan sınıfın sınıf değeri

Sınıf Aralığı

f* b toplamı

Page 47: İSTATİSTİK (STATİSTİCS) NEDİR?

Örnek: Bir çiftlikte 1 - 3 kg arasında yapağı veren 300 baş koyunun yıllık yapağı verimleri şöyledir. Bu dağılımın aritmetik ortalaması nedir?

Yapağı verimi (gr)

f

1000 - 1199 10

1200-1399 12

1400-1599 18

1600-1799 40

1800-1999 45

2000 - 2199 60

2200 - 2399 46

2400 - 2599 34

2600 - 2799 25

2800 - 2999 10

300

47

Page 48: İSTATİSTİK (STATİSTİCS) NEDİR?

yapağı verimi (gr) f

SD b f x b

1000 - 1199 10 1100 -5 -50

1200-1399 12 1300 -4 -481400-1599 18 1500 -3 -541600-1799 40 1700 -2 -801800-1999 45 1900 -1 -452000 - 2199 60 2100 0 02200 - 2399 46 2300 +1 462400 - 2599 34 2500 +2 682600 - 2799 25 2700 +3 752800 - 2999 10 2900 +4 40

300 -48

2068

48

200300

482100 xX

Page 49: İSTATİSTİK (STATİSTİCS) NEDİR?

TARTILI VEYA AĞIRLIKLI ARİTMETİK ORTALAMA

Bazı durumlarda serilerdeki terimler arasında önem dereceleri bakımından farklılıklar bulunabilir. Eğer ortalamanın hesaplanmasında bu farkların dikkate alınması gerekiyorsa ve de istenmiş ise, her terime veya değere, önem derecesi ile orantılı olmak üzere bir katsayı veya ağırlık verilmesi şarttır.

Böyle dağılımlarda ortalama hesap edilirken, ortaya katılacak ferdi değerlerin nispi önemlerinin dikkate alınmaması, bizi, yanıltıcı sonuçlara götürebilir.Ağırlıklı veya tartılı aritmetik ortalama, ancak birimlerin her birinin değerine verilen önemin farklı olması durumlarında kullanılır.

49

Page 50: İSTATİSTİK (STATİSTİCS) NEDİR?

Örnek:Fakültemizdeki bir öğrencinin birinci sınıfta okuduğu çeşitli derslerden aldığı notlar ve bu derslere ilişkin kredi saatleri veya haftalık ders saatleri aşağıdaki verilmiştir. Bu dağılımın ağırlıklı aritmetik ortalamasını bulunuz.

Dersin Adı Haftalık ders saati/ kredi (t)

Alınan Not (X) t.X

Fizik 5 70 350

Anatomi 4 60 240

Kimya 4 80 320

İstatistik 2 85 170

İngilizce 3 65 195

Biyoloji 1 90 90

TOPLAM 19 450 1.365

Ağırlıklı Aritmetik Ortalama = 1.365/19 = 71,84'dür.

Oysa, cetveldeki değerlere göre çeşitli derslerden alınan notların tartısız ortalaması; 450/6= 75’dir.

50

Page 51: İSTATİSTİK (STATİSTİCS) NEDİR?

GEOMETRİK ORTALAMA

Birim değerlerinin (gözlem sonuçlarının) birbirleriyle çarpımlarının, n birim sayısı olmak üzere, n’ inci dereceden köküne denir.Birim değerleri X1, X2, ... , Xn gibi gösterilirse geometrik ortalama aşağıdaki gibi yazılır:

İstatistiksel araştırmalarda gözlem sonuçları arasındaki oransal farkların mutlak farklardan daha önemli olduğu durumlarda geometrik ortalamaya başvurulur. Diğer bir ifade ile gözlem sonuçlarının her biri bir önceki gözlem sonucuna bağlı olarak değişiyorsa ve bu değişmenin hızı saptanmak istenirse geometrik ortalama sağlıklı sonuçlar verir.Geometrik ortalama bulmak veri değerlerinin pozitif olmasi gerekir. Yukarıdaki formülden de anlaşılacağı üzere gözlemlerden birisinin değeri sıfır veya negatif ise, geometrik ortalama hesaplanmaz.

Page 52: İSTATİSTİK (STATİSTİCS) NEDİR?

Geometrik Ortalamanın Özellikleri

-Geometrik ortalama, aritmetik ortalama gibi, hesapla bulunan bir ortalamadır ve ortalamaya katılan tüm değerler tarafından belirlenir.

-Geometrik ortalama, aşırı değerlerden, aritmetik ortalamaya oranla, daha az etkilenir; yani, serideki aşırı büyük değerlere karşı, aritmetik ortalama kadar hassas değildir. Bu nedenle, böyle değerler ihtiva eden seriler için, ortalama hesaplanmak istenmişse, geometrik ortalama tercih edilmelidir.

-Geometrik ortalama, aritmetik ortalamadan daha küçük çıkar. -Terimler arasındaki fark büyüdükçe, geometrik ortalama ile

aritmetik ortalama arasındaki fark artar. Aksine, terimler arasındaki fark azaldıkça, aritmetik ortalama ile geometrik ortalama arasındaki fark azalır.

-Değerler arasındaki farklar büyüdükçe, geometrik ortalama aritmetik ortalamadan uzaklaşır. Bu nedenle de, serideki terimler arasında çok büyük farkların bulunması durumunda, geometrik ortalamanın kullanılması daha uygun olur.

52

Page 53: İSTATİSTİK (STATİSTİCS) NEDİR?

ÖDEV

1. Aritmetik ortalama ?

2. Verileri sınıflandırıp, sıklık tablosunu oluşturun.

3. Sınıflandırılmış verilerde ortalama hesaplayın?53

Page 54: İSTATİSTİK (STATİSTİCS) NEDİR?

MEDYAN (ORTANCA)

• Dağılımın orta noktasındaki değer olarak tanımlanır.•Veriler küçükten büyüğe doğru dizildiğinde, serinin tam ortasında

bulunan değere medyan veya ortanca adı verilir. •Büyüklük sırasına göre düzenlenmiş bir sayı setinin medyanı, orta değer

veya iki orta değerin aritmetik ortalamasıdır. ,•Medyan, bir dağılımı iki eşit parçaya bölen birim değeri olduğu,

hesabında sadece tam ortaya rastlayan değeri dikkate aldığı, diğer terimleri hesaplama dışı bıraktığı için, analitik olmayan bir ortalamadır.

54

Page 55: İSTATİSTİK (STATİSTİCS) NEDİR?

55

l – Sınıflanmamış verilerde Medyanın Hesaplanması

Medyanı hesaplamak için, veriler, küçükten büyüğe doğru dizilir, tam ortaya isabet eden değer, medyan olarak kabul edilir.

•Ancak, denek sayısı çift ise, tam ortaya bir birim düşmeyecektir. Böyle durumda, ortadaki iki değerin aritmetik ortalaması medyan olacaktır.

• Örneğin, yaşları 5, 7, 8, 10, 12,15 ve 20 olan 7 çocuklu bir ailede ortanca yaş, dizide tam ortaya düşen dördüncü kardeşin yaşını gösteren 10 değeridir.

•Eğer bu aileye yeni bir çocuk daha katılacak olursa, o zaman çocuk sayısı çift, yani 8 olacak;

1, 5, 7, 8, 10, 12,15 ve 20tam ortaya 8 ve 10 yaşlarında iki çocuk rastlayacak, medyan yaşta, bu iki

çocuğun yaşlarının aritmetik ortalaması 8+10/2 =9 olacaktır.

Page 56: İSTATİSTİK (STATİSTİCS) NEDİR?

Sayısal verilerin fazla olmadığı durumlarda yukarıdaki hesaplamalar kolay ve de medyanın bulunması gayet basittir. Ama, sayısal verilerin fazlalığında, ortancanın bulunması oldukça güçleşir.

Veri sayısı tek ise (n + l / 2). değer medyandır.

Veri sayısı çift rakam ise, (n / 2). ve (n+2 / 2). değerlerin aritmetik ortalaması medyandır.

Örnek: 25 trafik kazasında vakasında sürücü yaşları şöyledir:(10, 16, 19, 21, 24, 24, 25, 22, 21, 20, 20, 11,14, 16, 17, 15, 15, 19, 18, 21, 20, 23, 23, 28, 26)

Burada, medyan değeri bulabilmemiz için, önce verileri aşağıdaki gibi küçükten büyüğe doğru dizeriz.10, 11, 14, 15, 15, 16, 16, 17, 18, 19, 19, 20, 20, 20, 21, 21, 21, 22, 23, 23, 24, 24, 25, 26, 28

Yukarıdaki örnekte veri sayısı tek (25) olduğu için, tam ortaya bir birim düşmektedir. Bu değer medyandır.

56

Page 57: İSTATİSTİK (STATİSTİCS) NEDİR?

57

l – Sınıflanmış verilerde Medyanın Hesaplanması

• Sınıflar yazılır •Her sınıfın Frekansı yazılır.•Yığılımlı frekan s (Yf) bulunur.•Sınıflanmış verilerde Medyan formulü:

Medyanın içinde bulunduğu sınıfın SAD

Medyanın içinde bulunduğu sınıfın bir üstündeki sınıfın Yığılımlı frekansı

Medyanın içinde bulunduğu sınıfın frekansı

Sınıf aralığı

Page 58: İSTATİSTİK (STATİSTİCS) NEDİR?

58

Yapağı verimi (gr)

f Yf

1000 - 1199 10 10

1200-1399 12 22

1400-1599 18 40

1600-1799 40 80

1800-1999 45 125

2000 - 2199 60 185

2200 - 2399 46 231

2400 - 2599 34 265

2600 - 2799 25 290

2800 - 2999 10 310

300

Medyan : n/2= 150185 : Yf bulunduğu sınıfta yer alıyor.L= 1999+2000/2=1999,5Yf =125 f= 60 C=200

=2082,8

Page 59: İSTATİSTİK (STATİSTİCS) NEDİR?

Medyanın Uygulanma Alanı ve Özellikleri

1-Ortancanın hesaplanması, özellikle basit serilerde çok kolaydır. Verileri ayrı ayrı değerlendirmeye katmadan medyan hesaplanabilir.

Örneğin bir sınıftaki öğrencilerin ortalama boy uzunluğunu tespit etmek için, öğrencilerin boylarını ayrı ayrı ölçmeye gerek kalmadan, bunları küçükten büyüğe doğru sıralar, yani öğrencileri boy sırasına göre dizer, terim sayısı tek ise, en ortadaki öğrencinin boyunu, çift ise en ortada kalan iki öğrencinin boylarını ölçer, aritmetik ortalamasını bulur, böylece medyanı, yani ortalama boy uzunluğunu kolayca hesaplayabiliriz.

2-Medyan, örnekteki gözlem sayısından etkilenir. Örnekteki uç değerlerden , aşırı değerlerden pek etkilenmez. Daha doğrusu, aritmetik ortalama kadar hassas değildir. Bu nedenle anormal değerleri, çok küçük veya çok büyük değerleri kapsayan örneklerde, seriyi en iyi temsil edebilecek ortalama medyandır. Böyle durumlarda aritmetik ortalama, gerçeği yansıtmayabilir.

Örnek: Bir bulaşıcı hastalığın kuluçka süresi 4, 5, 6, 6, 7, 7, 8, 8, 30 gün olarak gözlenmiş ise; bu hastalıkta ortalama kuluçka süresi aritmetik ortalamaya göre, X =81/9 = 9 gün; medyana göre ise 7 gün olarak bulunur.

Bu ve benzer örneklerde ortalamanın hesaplanmasında, medyanın kullanılması daha doğru olur. 59

Page 60: İSTATİSTİK (STATİSTİCS) NEDİR?

3-Bazı dağılımlarda alt veya üst değerler ya da hem alt ve hem de üst değerler belirsizdir. Böyle açık sınıflı seriler için, diğer ortalamalar, gerçekten oldukça uzaklaşır. Çünkü bu hesaplamalarda belirsiz olan sınıf hudutlarının tahmini olarak tayini söz konusudur; ve yapılacak bu tahminler, şahıslara göre de değişebilecektir. Bu nedenle, açık sınıflı serileri temsil edebilecek en iyi ortalama çeşidi, medyandır.Sıraya dizilen veriler arasında açıklık veya eksiklik varsa, örneğin bir dağılımdaki ferdi değerler 35, 40, 43, 50, 51, 60, 63, 65, 70 biçiminde ise, ortalama değer olarak, beşinci terim 51, seriyi en iyi şekilde temsil etmektedir. Serinin iki veya bir ucunun açık bırakıldığı durumlarda, örneğin 50'den az, 100'den yukarı gibi durumlarda, medyan, ortalama değer olarak seriyi daha iyi temsil edebilmektedir.

4-Medyanın aritmetik bir özelliği yoktur. Çünkü hesaplanmasında bütün birimler rol oynamaz.

60

Page 61: İSTATİSTİK (STATİSTİCS) NEDİR?

MOD (TEPE DEĞERİ)

Mod, bir dağılımda en fazla tekrar edilen, en çok gözlenen değerdir. Mod, en büyük frekansına karşılık gelen terimdir. Mod, bir dağılım içinde en popüler değeri gösterir. Modun, en fazla kullanılan, veya yaygın olan ya da sık görülen anlamlarına gelen moda kelimesi ile yakın bir ilişkisi vardır. Bu nedenle de mod, moda olan, göze en çok görülen değer olarak da tanımlanabilir.

Mod, bir frekans dağılımının pozisyonunu ve eğilimini belirlemede, en fazla kullanılan merkezsel eğilim ölçülerinden birisidir. Uygulamada, bazı alanlarda diğer ortalamalara oranla, mod, daha çok kullanılır. Örneğin sanayi işletmelerinde görülen iş kazalarının temel nedenlerinin araştırılmasında, tepe değerinden yararlanılır. Hazır giyim sanayiinde, elbise ve ayakkabıların hangi ölçülerde ne miktarda üretileceği konusunda moddan faydalanılır. Esasında moda kelimesi de buradan kaynaklanır.

Mod, eğer bir değişkenin almış olduğu değerlerden her hangi birisi, diğerlerine oranla daha fazla gözlenirse, o zaman bir anlam taşır. Tepe değeri, özellikle verilerin simetrik dağılım göstermedikleri durumlarda iyi bir yer ölçüsü olmaktadır.

61

Page 62: İSTATİSTİK (STATİSTİCS) NEDİR?

Modun Hesaplanması

Basit serilerde modun bulunması gayet kolaydır. Burada, bir dağılımda en fazla tekrarlanan gözlem değeri mod olarak kabul edilir.Örneğin 10 hastanın kan basıncı (mm / Hg olarak) 135, 140, 150, 140, 145, 140, 11, 100, 120, 130 ise; bu dağılımın modu, en fazla gözlenen değer 140 mm/Hg'dir.

Özellikleri1-Bazı serilerde modun bulunması mümkün değildir. Örneğin bir serideki değerlerin dağılımı l, 2, 3, 4, 5, 6, 7, 8, 9, 10 şeklinde ise, bu serinin modu yoktur. Çünkü, tüm değerler eşit sayıdadır.2- Bir dağılımda tepe değeri olabilecek birden fazla değer görülüyorsa, ortalama değer olarak mod kullanılmamalıdır. Örneğin sınıfımızdan rastgele seçtiğimiz 29 öğrencinin boyları cm olarak 154, 156, 158, 160, 164, 164, 165, 165, 165, 166, 166, 167, 168, 168, 168, 169, 169, 170, 170, 170, 171, 173, 173, 176, 178, 179, 180, 185 cm ise, böyle bir dağıtımda tepe değer olabilecek 3 değer (165, 168, 170) vardır. Oysa, birbirinden farklı bu üç değerin, üçünü de mod olarak kullanmanın her hangi bir anlamı yoktur.

62

Page 63: İSTATİSTİK (STATİSTİCS) NEDİR?

63

Aritmetik ortalama, medyan, mod arasındaki ilişki:• Simetrik dağılımlarda ortalama, medyan, mod birbirine eşittir.

X=Mod=Medyan

• Sağa Çarpık dağılımlarda

X>Medyan>Mod

• Sola Çarpık dağılımlarda

X<Medyan<Mod

Page 64: İSTATİSTİK (STATİSTİCS) NEDİR?

ORTALAMA TİPİNİN SEÇİMİ

1-Ortalama tipinin seçiminde, kalıplaşmış her hangi bir kural yoktur. Ancak, uygun bir ortalama çeşidinin seçimi, bazı özelliklerin dikkate alınması ile mümkündür.

2-Ortalama tipini tayinde, araştırmanın önemi ve ortalama hesaplamanın amacı, en önde gelen faktörler arasında yer alır. Ortalamaların kullanılış yerleri farklı olduğuna göre, o amacı en iyi biçimde yerine getirecek olan ortalama çeşidini seçmek gerekir.

3-Eğer verilere ileri istatistik analizler uygulanacaksa, aritmetik ortalama tipinin kullanılması daha uygundur. Ortalama karşılaştırma amacıyla hesaplanmak işlenmişse, aritmetik ortalama tercih edilir. Çünkü aritmetik ortalama, bütün değerler tarafından belirlenen en duyarlı ortalama çeşididir.

4-Dağılımdaki değerlerden yalnız bilgi edinmek isteniliyorsa, yerine göre medyan ya da mod kullanılır. Çünkü, bunlar, aritmetik ortalama kadar uç değerlerden etkilenmez.

5-Terimlerin kendileri yerine, oranları bizi ilgilendiriyorsa, serinin geometrik ortalaması hesaplanır. 64

Page 65: İSTATİSTİK (STATİSTİCS) NEDİR?

6-Sıfır veya negatif değerlere sahip serilerde geometrik ortalama hesaplanamaz.

7-Aşırı değerler ihtiva eden seriler için, aritmetik ortalama uygun olmaz.

8-Ortalama tipinin seçiminde, yukarıdaki bazı ilkeler yanında, ortalamanın hesabındaki kolaylık ya da zorluk da dikkate alınmalıdır.

9-Ayrıca, hangi ortalama tipi seçilirse seçilsin, serideki terimler arasında bir önem farkı bulunuyorsa, o ortalamanın tartılı şekli he saplanmalıdır.

65

Page 66: İSTATİSTİK (STATİSTİCS) NEDİR?

Aşağıda en uygun ortalama tipinin seçimiyle ilgili bazı örnekler verilmiştir.

l- Aşağıdaki basit seri için hangi ortalama tipi daha uygundur? Neden?2, 6, 20, 190, 180, 25, 27, 30, 40, 13, 12, 16, 205, 90, 180, 200, 250, 230, 18, 15

Geometrik ortalamanın kullanılması daha uygun olur.Seri terimleri arasında büyük farklar vardır.

2- Konya ilinde geçen hafta ölçüler hava sıcaklıkları dağılımı aşağıda verilmiştir. Bu değerlere hangi ortalama uygulanamaz. 0, l, 3, 5, 7, 10, 16, 20

Geometrik ortalama

66

Page 67: İSTATİSTİK (STATİSTİCS) NEDİR?

ÖRNEK:

Bir çiftlikteki koyunlardan örnek olarak seçilen 26'sının hemoglogbin değerleri aşağıda verilmiştir. Bu veriler için ortalama, mod, medyan hesaplayınız, aralarındaki ilşkiyi grafik ile belirtiniz.(11.0, 11.2, 11.3, 11.4, 11.4, 11.5, 11.6, 11.7, 12.5,13.0, 12.9,11.5, 12.7, 13.8, 14.0, 12.7, 11.8, 11.8, 11.9, 11.9, 12.0, 12.1, 12.2, 12.3, 10.9, 11.1, 12.5, 11.9, 13.7, 13.8)

.

67

Page 68: İSTATİSTİK (STATİSTİCS) NEDİR?

Aşağıdaki dağılımlardan hangisinde medyanı kullanmak daha doğrudur?

a-9, 22, 30, 21, 20, 32, 17, 14, 29, 53, 6, 60, 18, 15, 23, 21, 27b-164, 169, 169, 170, 171, 167, 135, 170, 168, 170, 180, 159, 167, 175c-11.9, 11.8, 11.3, 11.7, 11.6, 11.5, 11.4, 11.6, 12.4, 13.6, 11.1, 13.3d-210, 212, 211, 210, 208, 212, 213, 214, 212, 214, 210, 220, 225e-111, 114, 115, 112, 113, 110, 117, 116, 117, 119, 117, 120, 122, 125

a seçeneğindeki verilere ortalama hesabında, medyanın uygulanması daha doğru olur. Çünkü burada, dağılımı etkileyebilecek aşırı değerler (6, 9, 53, 60) vardır.

68

Page 69: İSTATİSTİK (STATİSTİCS) NEDİR?

ÇEYREK VE YÜZDELİKLER

69

Çeyrek ve yüzdelikler dağılımın herhangi bir noktasını gösterir.

Örneğin, 1. çeyrek 25. yüzdeliktir. 2. çeyrek 50. yüzdeliktir yani medyandır. 3. çeyrek 75. yüzdeliktir.

Page 70: İSTATİSTİK (STATİSTİCS) NEDİR?

70

Sınıflanmış verilerde Çeyrek ve Yüzdeliklerin hesabı

• SAD bulunur. Bir üsteki sınıfın üst sınırı ile bir alttaki sınıfın alt sınırının ortalamasıdır.

• ….. Den az kolonu oluşturulur. Her SAD’dan az kaç denek olduğu sayı ve % ile yazılır.

• Formül:

Verilen yüzde

Den az % kolununda X1 düştüğü aralığın altındaki % değer

Den az % kolununda X1 düştüğü aralığın üstündeki % değer

X2 nin SAD

X3 nin SAD

Page 71: İSTATİSTİK (STATİSTİCS) NEDİR?

71

Sınıflanmış verilerde Çeyrek ve Yüzdeliklerin hesabı

Yapağı verimi (gr) f

SAD…den az

Sayı %

1000 - 1199 10 999,5 0 01200-1399 12 1199,5 10 3,33 1400-1599 18 1399,5 22 7,331600-1799 40 1599,5 40 13,331800-1999 45 1799,5 80 26,662000 - 2199 60 1999,5 125 41,662200 - 2399 46 2199,5 185 61,662400 - 2599 34 2399,5 231 772600 - 2799 25 2599,5 265 88,332800 - 2999 10 2799,5 290 96,66

300

Page 72: İSTATİSTİK (STATİSTİCS) NEDİR?

72

Soru: Koyunların % 25 ‘ i hangi değerden daha az değer almışlardır.

X1= 25X2 = 13,33X3 = 26,66X2 SAD=1599,5X3 SAD= 1799,5

X= 1774,5

Page 73: İSTATİSTİK (STATİSTİCS) NEDİR?

73

Soru: Koyunların % 60 ‘ i hangi değerden daha az değer almışlardır.

Page 74: İSTATİSTİK (STATİSTİCS) NEDİR?

DAĞILIMIN YAYGINLIK ÖLÇÜLERİ

1. Standart Sapma ve Varyans

2. Varyasyon Katsayısı

3. Standart Hata

Page 75: İSTATİSTİK (STATİSTİCS) NEDİR?

1- Standart Sapma ve Varyans

Aritmetik ortalama dağılımın orta nokta noktasını gösteren bir ölçüdür. Ancak dağılımın yaygınlığı hakkında bilgi vermez.

10 22 34 ORTALAMA: 66/3=2221 23 22 ORTALAMA: 66/3=22

Standart sapma (S): Dağılımdaki her bir değerin ortalamaya göre ne derece uzakta olduğunu, başka bir ifade ile dağılımın ne yaygınlıkta olduğunu gösteren bir ölçüdür. Bir dağılımda değerler ortalamdan uzaklaştıkça dağılımın yaygınlığı artar.

Standart sapmanın karesi varyans (S 2)olarak adlandırılır.

Page 76: İSTATİSTİK (STATİSTİCS) NEDİR?

76

% 68,2

% 95,4

% 99,6

Page 77: İSTATİSTİK (STATİSTİCS) NEDİR?

Sınıflandırılmamış Verilerde Standart Sapma

1

1

1

2

2

n

n

ii

S

n

ii

xx

1. Deneklerin aldıkları değerler toplanır2. Deneklerin aldıkları değerlerin kareleri alınarak toplanır.3. Formülde yerine konur.

Kareleri toplamı

Değerleri toplamı

Page 78: İSTATİSTİK (STATİSTİCS) NEDİR?

78

Denek No

Hb Xi Hb Xi2

1 13,0 169,00

2 13,6 184,96

3 14,0 196,00

. . .

. . .

29 15,0 225,00

30 10,3 106,09

Toplam 366,0 4523,26

Örnek : 30 adet Laboratuvar faresinin hemoglobin değerlerinin standart sapması kaçtır.

41,1

13030

26,4523366

2

S

Page 79: İSTATİSTİK (STATİSTİCS) NEDİR?

Sınıflandırılmış Verilerde Standart Sapma

1

2

2

nn

fcS

fbb

1. Frekansları ile birlikte Sınıflar yazılır, 2. Sınıf değerleri (SD) bulunur ve her sınıfın karşısına yazılır. Sınıf

değeri sınıfın ortalamasıdır. 3. Çalışma birimi “b” kolonu oluşturulur. Yukarı doğru “-” aşağı doğru

“+” olacak şekilde 1 artırarak yazılır.4. Frekansla çalışma birimleri çarpımları (f*b) alınarak her sınıfın

karşısına yazılır. İşaretleri dikkate alınarak toplanır.5. Çalışma biriminin “b” nin karesi alınır her sınıfın karşısına yazılır.6. Her sınıfın frekansıkendi b2 değeri ile çarpılarak f*b2 kolonu

oluşturulur.7. Değerler formülde yerine konur.

Page 80: İSTATİSTİK (STATİSTİCS) NEDİR?

80

Ağır.Art f b fb b2 fb2

15-19 50 -3 -150 9 450

20-24 75 -2 -150 4 300

25-29 100 -1 -100 1 100

30-34 150 0 0 0 0

35-39 90 1 90 1 90

40-44 70 2 140 4 280

45-49 45 3 135 9 405

toplam 580 -35 1625

37,8

1580580

16255

1

352

2

2

S

nn

fcS

fbb

Örnek : Belirli bir süre beslenen sığırların canlı ağırlık artışının standart sapmasını hesaplayınız .

Page 81: İSTATİSTİK (STATİSTİCS) NEDİR?

2- Varyasyon Katsayısı

Varyasyon Katsayısı: Standart sapmanın ortalamaya göre gösterdiği değişimin yüzde olarak ifadesidir.

100. X

SKV

V.K ≤ 20 ise dağılım HomojenV.K > 20 ise dağılım Heterojendir.

Örnek: Ortalaması 31,7 S= 8,37 n: 580 olan dağılımın VK=?

4,26%1007,31

37,8. KV

Page 82: İSTATİSTİK (STATİSTİCS) NEDİR?

82

Page 83: İSTATİSTİK (STATİSTİCS) NEDİR?

3- Standart Hata

Aritmetik ortalama standart hata ile birlikte verilmelidir.

Sınıflandırılmış ve sınıflandırılmamış verilerde aynı formül kullanılır.

n

SS x

Örnek: Ortalaması 31,7 S= 8,37 n: 580 olan dağılımın standart hatası ?

35,0580

37,8S x

Ortalama: 31,7±0,35 şeklinde gösterilir.

Page 84: İSTATİSTİK (STATİSTİCS) NEDİR?

yapağı verimi (gr) f

SD b f x b

1000 - 1199 10 1100 -5 -50

1200-1399 12 1300 -4 -481400-1599 18 1500 -3 -541600-1799 40 1700 -2 -801800-1999 45 1900 -1 -452000 - 2199 60 2100 0 02200 - 2399 46 2300 +1 462400 - 2599 34 2500 +2 682600 - 2799 25 2700 +3 752800 - 2999 10 2900 +4 40

300 -48

=2068

84

X S= ? VK= ?

ÖRNEK

Page 85: İSTATİSTİK (STATİSTİCS) NEDİR?

TEORİK DAĞILIMLARİlgilenilen bir olayın gerçekleşme durumu, teorik bir dağılıma uyuyor ise olayın gerçekleşme olasılığı hesaplanarak olası sonuçlar tahmin edilebilir. Çok sayıda teorik dağılım mevcuttur. Veteriner Hekimlik alanında sıkça kullanılan dağılımlar;

1- Binomiyal Dağılım

2- Poisson Dağılım

3- Normal Dağılım

Page 86: İSTATİSTİK (STATİSTİCS) NEDİR?

Binomiyal DağılımSayımla belirtilen kesikli değişkenlerin dağılımıdır. Bir olayın oluş olasılığının (p) büyük, denek sayısının (n) küçük olduğu durumlarda olasılık hesaplanmasında kullanılır.

Binomiyal dağılımda incelenen olayın birbirinden bağımsız iki olası sonucu vardır. Başarı (p), Başarısızlık (q) veya (1-p) p=q ise dalığım simetriktir.

P 0 binomiyal dağılım poisson dağılımına yaklaşır

Binom dağılımında denemeler birbirinden bağımsızdır. Bir sonucun ortaya çıkması diğer olayın ortaya çıkmasını etkilemez.

Page 87: İSTATİSTİK (STATİSTİCS) NEDİR?

87

nrrrn

n

r

nrP qpqp

rnrrnr,...,2,1,0

!)!(

!)(

n: Toplam olay sayısı r: İstenen olayın oluş sayısıp: İstenen olayın gerçekleşme olasılığı q: İstenen olayın gerçekleşmeme olasılığı

Page 88: İSTATİSTİK (STATİSTİCS) NEDİR?

Örnek:Doğum esnasında bir domuz yavrusunun dişi olma olasılığı %50’dir. Ultrason sonucu 4 yavru doğurması beklenen bir dişi domuzun 1,2 ve 3 yavrusunun dişi olma olasılığı hesaplansın

25,0)5,01( 345,0 3!3)!34(

!4)5,01( 345,0 334)3(

375,0)5,01( 245,0 2!2)!24(

!4)5,01( 245,0 224)2(

25,0)5,01( 145,0 1!1)!14(

!4)5,01( 145,0 114)1(

xxp

xxp

xxp

Page 89: İSTATİSTİK (STATİSTİCS) NEDİR?

Poisson DağılımıSayımla belirtilen değişkenlerin dağılımıdır. İncelenen olayın görülme olasılığı (p) küçük, n büyük olduğunda olasılık hesaplamak için kullanılır.

r: İstenen olayın oluş sayısı

Örnek: Bir bölgedeki veteriner kliniğine gece muayene için gelen hasta sayısının Poisson dağılım gösterdiği bilinsin, Kliniğe gece ortalama 4 hasta geldiğine göre; Herhangi bir gece kliniğe 2 hasta gelme olasılığı

144,0018,02

16

!2)2(

42

4

eP

eX xr

rrP

!

)(

Page 90: İSTATİSTİK (STATİSTİCS) NEDİR?

Normal DağılımÖlçümle belirtilen (sürekli) değişkenlerin dağılımıdır. Ortalama ve Std. Sapma her farklı değeri için farklı bir normal dağılım oluşturulur.

Page 91: İSTATİSTİK (STATİSTİCS) NEDİR?

91

Normal dağılımın özellikleri

- Normal dağılım ortalamaya göre simetriktir.- Eğri ile x ekseni arasındaki toplam alan 1 birim

karedir.- Aritmetik ortalama, ortanca ve tepe değeri

birbirine eşittir.- X± 1 Std. Sapma arasındaki toplam alan %

68,26- X± 2 Std. Sapma arasındaki toplam alan %

95,44- X± 3 Std. Sapma arasındaki toplam alan %

99,74

- Dağılım çan eğrisi biçimindedir.

% 68,2

% 95,4

% 99,7

Page 92: İSTATİSTİK (STATİSTİCS) NEDİR?

Standart Normal DağılımHer farklı ortalama ve standart sapma farklı dağılımlar ürettiğinden, her dağılım için ayrı eğri altında alan hesaplamasının getireceği hesaplama zorluklarından kurtulmak için dağılımın standart tek bir dağılıma dönüştürülmesi yoluna gidilmiştir. Standartlaştırma için uygulanılan formül;

sxxz

Page 93: İSTATİSTİK (STATİSTİCS) NEDİR?

93

Örnek: Bir toplumda kan basıncı değerlerinin ortalamasının 130 mmHg, standart sapmasının 25 mmHg ile normal dağılım gösterdiği bilinmektedir. -Kan basıncı 110-140 mmHg arasında bulunan kişi yüzdesi nedir?

sxxz

4,025

1301402 8,0

25

1301101

zz

Z1=0,288Z2=0,155

Z1 +Z2 =0,4435 Toplumdaki kişilerin % 44,35 nin kan basıncı 110-140 arasındadır.

Page 94: İSTATİSTİK (STATİSTİCS) NEDİR?

94

Örnek: Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği, 125 cm ortalamave 20 cm standart sapma ile normal dağılım göstermektedir. Buna göre aşağıdaki şıkları α=0.05 alarak çözümleyiniz.

a)Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 130 cm üzerinde olma olasılığı nedir?

Ödev

b) Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 110 cm altında olma olasılığı nedir?

c) Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 110 cm ile 130 cm arasında olma olasılığı nedir?

Page 95: İSTATİSTİK (STATİSTİCS) NEDİR?

95

a: P(X>130)=? Bu olasılığı bulmak için 125 cm ortalama 20cm standart sapma ile normal dağılan X değerini, 0 ortalama ve 1 standart sapma ile standart normal dağılıma sahip Z skoruna çevirmek gerekir. Bunun için:

olarak bulunur.

Standart normal dağılım üzerinde z=0,25 değerinden büyük olan alan bize aradığımız olasılık değerini verecektir.

Bunun için standart normal dağılım tablosundan z=0,25’e karşılık gelen olasılık tablo değeri =0,0987 olarak bulunur. Bu değer standart normal dağılım üzerinde 0’dan 0,25’e kadar olan alanı vermektedir.

Sağlıklı bir yetişkin bireyin kan basıncı seviyesi değerinin 130 mmHg üzerinde olma olasılığının değeri P(X>130)=P(z>0,25)=0,5-0,0987 = 0,4013.

0,250

25,020

125130

S

XxZ

0,250

0,0987