Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel...

Post on 19-Mar-2016

115 views 2 download

description

SİU 2009. Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler. Ethem Alpaydın Boğaziçi Üniversitesi alpaydin@boun.edu.tr http://www.cmpe.boun.edu.tr/~ethem. Giriş. Sorular: Bir sınıflandırıcının hatasını nasıl ölçebiliriz? - PowerPoint PPT Presentation

Transcript of Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel...

Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler

Ethem AlpaydınBoğaziçi Üniversitesialpaydin@boun.edu.trhttp://www.cmpe.boun.edu.tr/~ethem

SİU 2009

SİU 2009 Eğitim semineri E Alpaydın Nisan 20092

Giriş Sorular:

Bir sınıflandırıcının hatasını nasıl ölçebiliriz?

İki sınıflandırıcının hatasını nasıl karşılaştırabiliriz?

Öğrenme/geçerleme/deneme kümeleri Yeniden örnekleme: K-kat çapraz geçerleme Parametrik ve parametrik olmayan testler İkiden çok sınıflandırıcının karşılaştırılması Tek/çok veri kümesi Hata dışındaki ölçütlerin karşılaştırılması

SİU 2009 Eğitim semineri E Alpaydın Nisan 20093

Yöntemlerin Karşılaştırılması Kıstaslar (Uygulamaya bağlı olarak):

Sınıflandırma hatası (Risk, kayıp fonksiyonları)

Öğrenme zaman/bellek karmaşıklığıDeneme zaman/bellek karmaşıklığıYorumlanabilirlikKolay programlanabilme

Masraf (karmaşıklık) duyarlı öğrenme

SİU 2009 Eğitim semineri E Alpaydın Nisan 20094

Öğrenme, Ezberleme, Genelleme

Deneme Kümesi

Geçerleme Kümesi

Öğrenme Kümesi

Çapraz geçerleme

SİU 2009 Eğitim semineri E Alpaydın Nisan 20095

Yeniden Örnekleme K-Kat Çapraz Geçerleme Birden çok öğrenme/gerçekleme kümesi yaratmak için

{Xi,Vi}i: kat i X, K parçaya ayırılıyor: Xi,i=1,...,K

K-2 parça ortak Sınıf olasılıklarının korunması

121

31222

32111

KKKK

K

K

XXXTXV

XXXTXVXXXTXV

SİU 2009 Eğitim semineri E Alpaydın Nisan 20096

1510

2510

259

159

124

224

223

123

112

212

211

111

XVXTXVXT

XVXTXVXTXVXTXVXT

5×2 Çapraz Geçerleme 5 kere 2 kat çapraz geçerleme (Dietterich, 1998)

SİU 2009 Eğitim semineri E Alpaydın Nisan 20097

Aralık Kestirimi X = { xt }t , xt ~ N ( μ, σ2) m ~ N ( μ, σ2/N)

100(1- α) %güven aralığı

1

950961961

950961961

22 Nzm

NzmP

.N

.mN

.mP

..mN.P

~mN

//

Z

SİU 2009 Eğitim semineri E Alpaydın Nisan 20098

1

950641

950641

NzmP

.N

.mP

..mNP

Tek taraflı güven aralığı

SİU 2009 Eğitim semineri E Alpaydın Nisan 20099

1

1

1212

122

NStm

NStmP

t~SmNN/mxS

N,/N,/

Nt

t

σ2 bilinmediğinde:

SİU 2009 Eğitim semineri E Alpaydın Nisan 200910

Hipotez Testleri Sıfır hipotezi H0

Örneğin, H0: μ = μ0 vs. H1: μ ≠ μ0 Eğer μ0 , 100(1- α) güven aralığına düşmüyorsa H0 reddedilir

X = { xt }t , xt ~ N ( μ, σ2)

Çift taraflı test 22

0// z,zmN

SİU 2009 Eğitim semineri E Alpaydın Nisan 200911

Tek taraflı test: H0: μ ≤ μ0 vs. H1: μ > μ0 H0 reddedilmez eğer

Varyans bilinmiyorsa; z yerine t dağılımı H0: μ = μ0 reddedilmez eğer

z,mN 0

12120

N,/N,/ t,tSmN

SİU 2009 Eğitim semineri E Alpaydın Nisan 200912

Testin hata tipleri ve gücü

Karar

Gerçek Kabul Red

H0 Doğru Doğru karar Birinci tip hata ()

H0 Yanlış İkinci tip hata ()

Doğru karar (Güç)

SİU 2009 Eğitim semineri E Alpaydın Nisan 200913

Hata Ölçülmesi: H0: p ≤ p0 vs. H1: p > p0 Tek öğrenme/geçerleme kümesi: Binom

TestiHata olasılığı p0 ise, en az e hata yapma olasılığı çok küçükse reddet:

SİU 2009 Eğitim semineri E Alpaydın Nisan 200914

Normal Approximation to the Binomial Hata sayısı X yaklaşık olarak N (Np0 ,

Np0(1-p0))

X = e için bu değer > zα ise reddet

1- α

Z~

pNpNpX

00

0

1

SİU 2009 Eğitim semineri E Alpaydın Nisan 200915

Birden çok Öğrenme/Geçerleme xt

i = 1 eğer kat i’de örnek t yanlış sınıflandırılırsa Kat i’de hata:

H0: p ≤ p0 vs. H1: p > p0 reddederiz, eğer

> tα,K-1

Nx

pN

tti

i 1

1

0

Kt~S

pmK

SİU 2009 Eğitim semineri E Alpaydın Nisan 200916

Sınıflandırıcıların Karşılaştırılması: H0: μ1 = μ2 vs. H1: μ1 ≠ μ2 K-kat Çapraz Geçerleme Eşlenmiş t testi pi

1, pi2: Sınıflandırıcı 1 ve 2’nin kat i’deki

hataları pi = pi

1 – pi2 : Kat i’deki eşlenmiş fark

Sıfır hipotezimiz pi ‘in beklenen değeri 0’dır:

1,2/1,2/1

1

221

00

, Reddet ~01

0: vs.0:

KKK

K

i iK

i i

tttsmK

smK

Kmp

sKp

m

HH

SİU 2009 Eğitim semineri E Alpaydın Nisan 200917

5×2 Çapraz Geçerleme Eşlenmiş t Testi (Dietterich, 1998) 5×2 çapraz geçerleme ile 5 tekrarda 2 kat

öğrenme/geçerleme kümesi oluşturulur pi

(j) : sınıflandırıcılar 1 ve 2’nin kat j=1, 2 tekrar i=1,...,5’deki farkı

Çift taraflı : Reddet H0: μ1 = μ2 eğer (-tα/2,5,tα/2,5) Tek taraflı: Reddet H0: μ1 ≤ μ2 eğer > tα,5

551

2

11

2221221

5

2

t~/s

ppppps/ppp

i i

iiiiiiii

SİU 2009 Eğitim semineri E Alpaydın Nisan 200918

5×2 Çapraz Geçerleme Eşlenmiş F Testi (Alpaydın, 1999)

Çift taraflı test: Reddet H0: μ1 = μ2 eğer > Fα,10,5

5105

12

51

21

2

2 ,

i i

i jj

i F~s

p

SİU 2009 Eğitim semineri E Alpaydın Nisan 200919

L>2 Sınıflandırıcı: Varyans Analizi (Anova)

L sınıflandırıcının K kattaki hataları

Reddedilirse ikili testler

LH 210 :

K,...,i,L,...,j,,~X jij 1 12 N

SİU 2009 Eğitim semineri E Alpaydın Nisan 200920

Anova tablosuDeğişken

liğin kaynağı

Karelerin toplamı

Serbestlik

derecesi

Ortalama Kare

F0

Gruplar arası

L-1

Grup içi L(K-1)Toplam LK-1

SİU 2009 Eğitim semineri E Alpaydın Nisan 200921

Çoklu Anakütle Testleriyle İlgili Bonferroni düzeltmesi: Eğer m test

sonunda bir karara varılacaksa, sonuç karar hassasiyetinin α olabilmesi için, her bir testin hassasiyetinin α/m olması gerekir.

Kontrastlar

SİU 2009 Eğitim semineri E Alpaydın Nisan 200922

MultiTest Yöntemiyle Sınıflandırıcıların Sıralanması (Yıldız ve Alpaydın, 2006) L sınıflandırıcı ön bir karmaşıklık ölçütüne

göre sıralanır: i<j olmak üzere ikili testlerle çizge

oluşturulur: Eğer H0: μi <= μj reddedilirse, (i,j) eklenir,

Topolojik olarak sıralanır

SİU 2009 Eğitim semineri E Alpaydın Nisan 200923

SİU 2009 Eğitim semineri E Alpaydın Nisan 200924

SİU 2009 Eğitim semineri E Alpaydın Nisan 200925

Parametrik olmayan testler İşaret testi Sıralama (rank) testleri: Kruskal-Wallis

testi Friedman sıralama testi Kullanımı:

Birden çok veritabanı üzerinde karşılaştırma

Sınıflandırma hatası dışındaki ölçütlerin (hız, bellek, vs) karşılaştırılması

SİU 2009 Eğitim semineri E Alpaydın Nisan 200926

Başarı Ölçütleri Hata = (FN+FP) / N Recall

= bulunan artılar/ toplam artılar = TP / (TP+FN) = sensitivity = hit rate

Precision = bulunan artılar / bulunanlar= TP / (TP+FP)

Specificity = TN / (TN+FP)

False alarm rate = FP / (FP+TN) = 1 - Specificity

Öngörü

Gerçek

Artı Eksi

Artı TP FN

Eksi FP TN

SİU 2009 Eğitim semineri E Alpaydın Nisan 200927

ROC Eğrisi

SİU 2009 Eğitim semineri E Alpaydın Nisan 200928

SİU 2009 Eğitim semineri E Alpaydın Nisan 200929

Sonuçlar Güven aralıkları <=> Örnek kümesi

büyüklüğü Öğrenme, ezberleme, genelleme Deney tasarımı

SİU 2009 Eğitim semineri E Alpaydın Nisan 200930

Kaynaklar M. Aytaç (2004) “Matematiksel İstatistik,” Ezgi

Yayınevi.