LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI (YSA) ve SINIFLANDIRMA ve REGRESYON...

T.C.

GAZOSMANPAA NVERSTES

SALIK BLMLER ENSTTS

LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI

(YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)

YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR

UYGULAMA

Hazrlayan

Yunus Emre Kuyucu

Biyoistatistik Anabilim Dal

Yksek Lisans Tezi

Danman

Yrd. Do. Dr. nal Erkorkmaz

Tokat-2012

LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI

(YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)

YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR

UYGULAMA

Tezin Kabul Edili Tarihi: 04/01/2012

Jri yeleri (Unvan, Ad Soyad) mzas

Prof. Dr. Hafize SEZER(Bakan)

Yrd. Do. Dr. nal ERKORKMAZ(ye, Danman retim yesi)

Yrd. Do. Dr. lker ETKAN(ye)

Bu tez, Gaziosmanpaa niversitesi Salk Bilimleri Enstits Ynetim Kurulunun

//. tarih ve . sayl oturumunda belirtilen jri tarafndan

kabul edilmitir.

Do. Dr. Hseyin ZYURT Mhr

Enstit Mdr mza

T.C.

GAZOSMANPAA NVERSTES

SOSYAL BLMLER ENSTTS MDRLNE

Bu belge ile bu tezdeki btn bilgilerin akademik kurallara ve etik ilkelere

uygun olarak toplanp sunulduunu, bu kural ve ilkelerin gerei olarak, almada bana

ait olmayan tm veri, dnce ve sonulara atf yaptm ve kaynan gsterdiimi

beyan ederim.

04/01/2012

Tezi Hazrlayan rencinin

Ad ve Soyad

Yunus Emre KUYUCU

mzas

TEEKKRBu tezin hazrlanmas aamasnda yardmlarn esirgemeyen, bana almamn

her aamasnda deneyim ve bilgileri ile yol gsteren danman hocam Yrd. Do. Dr.

nal ERKORKMAZ a, hocam Yrd. Do. Dr. lker ETKAN a, sevgisi ve destei ile

hep yanmda ve kalbimde olan eim Nagehan KUYUCU ya, biricik yavrumuz Elif Naz

KUYUCU ya ve desteklerinden dolay tm aileme teekkr ediyorum.

iZET

Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar (YSA) ve

Snflandrma ve Regresyon Aalar (C&RT) Yntemlerinin

Karlatrlmas ve Tp Alannda Bir Uygulama

Lojistik Regresyon, baml deikenin kategorik ve bamsz deikenlerin

kark lekli olmas durumunda belirli bir dalm varsaymna baml kalmakszn

baml deiken ile bamsz deikenler arasndaki neden-sonu ilikisinin

belirlenmesinde kullanlan bir yntemdir.

Yapay Sinir Alar, insan beynindeki sinir alar gibi alarak son derece

karmak yapya sahip problemlerin zmn salar. Kulland geriye yaylma

algoritmasn ile a hatasn minimize ederek birimlerin en az hata ile snflarna

atanmas iin an arlklarn hesaplar.

Snflandrma ve Regresyon Aalar (C&RT); ikili karar aac oluturan bir

yntemdir. Aataki her bir noda, her bir bamsz deiken iin geliim skoruna dayal

olarak en iyi kesim noktas ya da en iyi kategori gruplar oluturulur.

Bu tez almasnda, Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar

(YSA) ve Snflandrma ve Regresyon Aalar (C&RT) Yntemlerinin snflandrma

zelliklerinin karlatrlmas yaplmtr. Bu karlatrma iin prostat kanseri

ynnden deerlendirilmesi yaplan hastalara ait veriler kullanlm, ynteme gre

elde edilen sonular baar ynnden deerlendirilmitir.

Anahtar kelimeler: Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar (YSA),

Snflandrma Ve Regresyon Aalar (C&RT), Prostat Kanseri.

ii

ABSTRACT

Comparison of Logistic Regression Analysis (LRA), Artificial Neural

Networks (ANN) and Classfication and Regression Trees (C&RT)

Methods And An Aplication In Medicine

Logistic regression, categorical dependent variable and independent variables in

the case of mixed-scale without being dependent on the assumption that a certain

distribution of cause-effect relationship between the dependent variable and

independent variables used in the determination of a method.

Artificial Neural Networks, such as neural networks working in the human brain

is extremely complex structure provides the solution of problems. Error back

propagation algorithm uses the network by minimizing the weight of the units of the

network accounts for the appointment of classes with fewer errors.

Classification and Regression Trees (C & RT) is a method of forming a binary

decision tree. Each node in the tree, each independent variable on the basis of the best

cut-off point score for the development or the best category groups are created.

In this thesis, Logistic Regression Analysis (LRA), Artificial Neural Networks

(ANN) and Classification and Regression Trees (C & RT) characteristics of the

classification methods were compared. This comparison of the data used in patients

undergoing evaluation for prostate cancer in terms of the three methods to the results

obtained were evaluated in terms of success.

Key words: Logistic Regression Analysis (LRA), Artificial Neural Networks (ANN),

Classfication and Regression Trees (C&RT), Prostate Cancer.

iii

NDEKLER

ZET

ABSTRACT

NDEKLER

TABLOLAR LSTES V

EKLLER LSTES V

KISATMALAR VE SMGELER X

1. GR VE AMA 1

2. GENEL BLGLER 7

2.1. SINIFLAMA VE REGRESYON MODELLER 82.1.1. Karar Aalar 92.1.2. Yapay Sinir Alar 18

2.1.2.1. Yapay Sinir A Nedir? 192.1.2.2. Biyolojik Sinir Alar 242.1.2.3. Yapay Sinir Alarnda Genel Yap 262.1.2.4. Yapay Sinir Hcresi 272.1.2.5. Yapay Sinir Ann Temel Elemanlar 29

2.1.2.5.1. Giriler 302.1.2.5.2. Arlklar 302.1.2.5.3. Toplama levi 312.1.2.5.4. Etkinlik levi (Aktivasyon Fonksiyonu) 322.1.2.5.5. k levi 38

2.1.2.6. A Girilerinin Hesaplanmas in Matris arpma Metodu 382.1.2.7. Yapay Sinir Hcresinin alma Prensibi 39ekil 2.17da girileri ve arlklar verilmi olan bir yapay sinir hcresininalmas yledir: 39

2.1.3. Lojistik Regresyon Analizi 422.1.3.1. Lojistik Snflandrma ve Lojistik Regresyon Modeli 44

2.2. PROSTAT KANSER 472.2.1. Prostat Kanseri Hakknda Genel Bilgi 472.2.2. Prostat Nedir? 47

iv

2.2.3. Tehis 482.2.3.1. Prostatn Parmakla Muayenesi 482.2.3.2. Prostata zg Antijenin Belirlenmesi (PSA) 482.2.3.3. Makattan (rektum) Ultrason Muayenesi (TRUS) 49

3. GERE VE YNTEM 50

3.1. C&RT ALGORTMASI (Classification And Regression Trees: Snflama VeRegresyon Aalar) 51

3.1.1. Maksimum Aacn Oluturulmas 52

3.2. YAPAY SNR AI MODELLER 553.2.1. Tek Katmanl Alglayclar 55

3.2.1.1. Hebb Kural 563.2.1.2. Perseptron 57

3.2.1.2.1. Perseptron Algoritmas 583.2.1.2.2. Delta 61

3.2.2. ok Katmanl Alglayclar 613.2.2.1. Geriye Yaylm Algoritmas 633.2.2.2. Standart Geriye Yaylm Eitim Algoritmas 64

3.2.2.2.1. Geriye Yaylm Algoritma eitleri 653.2.2.2.2. Geri Yaym Mant 66

3.3. LOJSTK REGRESYON MODEL 693.3.1. Lojistik Regresyon Modelinin Oluturulmas 693.3.2. oklu Lojistik Regresyon Modeli 713.3.3. oklu Lojistik Regresyon Modelinin Kurulmas 723.3.4. Lojistik Regresyon Modelinde Katsaylarn Yorumlanmas 723.3.5. Modelde kiden Fazla Bamsz Deikenin Olduu Durum 73

3.4. YNTEMLERN KARILATIRILMASI N LTLER 73

3.5. WEKA 75

4. BULGULAR 78

4.1. TANIMLAYICI STATSTKLER 78

4.2. LOJSTK REGRESYON ANALZ 81

4.3. SINIFLANDIRMA VE REGRESYON AALARI 86

4.4. YAPAY SNR ALARI 93

v4.5. YNTEMLERN KARILATIRILMASI 99

5. TARTIMA VE SONU 100

KAYNAKLAR 104

EKLER 111

Ek 1. 111

vi

TABLOLAR LSTES

Sayfa

Tablo 2.1. Biyolojik Sinir Hcresi 25

Tablo 2.2. statistiksel Yntemler le Yapay Sinir AlarnnBenzeimi

26

Tablo 2.3. Toplama Fonksiyonu rnekleri Toplama levi 32

Tablo 2.4. Yaa zg Normal Serum PSA Deerleri 49

Tablo 4.1. Srekli Deikenler (Ya ve PSA) in Tanmlaycstatistikler (n=236)

78

Tablo 4.2. Kategorik Deikenler (Rektal Tue ve Genetik Yatknlk)in tanmlayc statistikler (n=236)

78

Tablo 4.3. Prostat Kanseri Tans Durumuna Gre SrekliDeikenlerin (Ya ve PSA) Dalm

79

Tablo 4.4. Prostat Kanseri Tans Durumuna Gre KategorikDeikenlerin (Rektal Tue ve Genetik Yatkn.) Dalm

80

Tablo 4.5. Odds Oranlar (LRA) 82

Tablo 4.6. Snflandrma Sonular-I (LRA) 82

Tablo 4.7. Snflandrma Sonular-II (LRA) 82

Tablo 4.8. Dzensizlik Matrisi Sonular (LRA) 83

Tablo 4.9. Snflandrma Sonular-I (C&RT) 86

Tablo 4.10. C&RT Snflandrma Sonular-II (C&RT) 86

Tablo 4.11. Dzensizlik Matrisi Sonular (C&RT) 87

Tablo 4.12. Snflandrma Sonular-I (YSA) 93

Tablo 4.13. YSA Snflandrma Sonular-II (YSA) 93

vii

Tablo 4.14. Dzensizlik Matrisi Sonular (YSA) 94

Tablo 4.15. Dm 0 in Arlklar 94





Tablo 4.20. Genel Karlatrma Tablosu 99

viii

EKLLER LSTES

Sayfa

ekil 2.1. Veri Madencilii Modelleri 7

ekil 2.2. Karar Aac Yaps 14

ekil 2.3. Basit Bir Yapay Nron 22

ekil 2.4. Basit Bir Yapay Sinir A 23

ekil 2.5. Biyolojik Sinir Sisteminin Blok Gsterimi 24

ekil 2.6. Biyolojik Sinir Hcresi 24

ekil 2.7. Yapay Sinir Alarnn Genel Yaps 26

ekil 2.8. Basit Alglayc Modeli 28

ekil 2.9. Dorusal veya Lineer Fonksiyon 33

ekil 2.10. Basamak Fonksiyonlar 34

ekil 2.11. Tek kutuplamal Basamak Fonksiyonu 35

ekil 2.12. ift Kutuplamal Basamak Fonksiyonu 35

ekil 2.13. Paral Dorusal Fonksiyon 36

ekil 2.14. Sigmoid Tipli Fonksiyon 37

ekil 2.15. Tanjant Hiperbolik Tipli Fonksiyon 37

ekil 2.16. Sins Tipli Fonksiyon 38

ekil 2.17. Yapay Sinir Ann alma rnei 40

ix

ekil 2.18. YSA de Kullanlan Geri Yaylml renmeAlgoritmas

41

ekil 3.1. Tek Arlk Katmanl Bir Yapay Sinir A 56

ekil 3.2. Basit Bir Perseptron Mimarisi 59

ekil 3.3. Tek Gizli Katmanl leri Beslemeli ok Katmanl BirYapay Sinir A

62

ekil 3.4. ok Katmanl Alglayc 63

ekil 3.5. Tek Gizli Katmanl leri Beslemeli ok Katmanl BirYapay Sinir A

64

ekil 3.6. Geri Yaym Mant 67

ekil 4.1. Rektal Tue sonularnn dalm 79

ekil 4.2. Genetik Yatknlk sonularnn dalm 79

ekil 4.3. Prostat Kanseri Tans Koyulan Hastalarn Rektal TueSonular

80

ekil 4.4. Prostat Kanseri Tans Konulmayan (Normal) HastalarnRektal Tue Sonular

80

ekil 4.5. Prostat Kanseri Tans Koyulan Hastalarn GenetikYatknlk Durumlar Dalm

81

ekil 4.6. Prostat Kanseri Tans Konulmayan (Normal) HastalarnGenetik Yatknlk Durumlar Dalm

81

ekil 4.7. LRA in ROC Erisi 83

ekil 4.8. Ya in Yanl Snflandrmalarn Gsterimi (LRA) 84

ekil 4.9. PSA in Snflandrma Hatalarnn Gsterimi (LRA) 84

ekil 4.10. Rektal Tue in Snflandrma Hatalarnn Gsterimi(LRA)

85

ekil 4.11. Genetik Yatknlk in Snflandrma HatalarnnGsterimi (LRA)

85

ekil 4.12. C&RT in ROC Erisi 87

xekil 4.13. C&RT - Algoritmas in Aa Gsterimi 90

ekil 4.14. Ya in Yanl Snflandrmalarn Gsterimi (C&RT) 91

ekil 4.15. PSA in Yanl Snflandrmalarn Gsterimi (C&RT) 91

ekil 4.16. Rektal Tue in Yanl Snflandrmalarn Gsterimi(C&RT)

92

ekil 4.17. Genetik Yatknlk in Yanl SnflandrmalarnGsterimi (C&RT)

92

ekil 4.18 YSA iin ROC Erisi 94

ekil 4.19 Yapay Sinir A Modeli 96

ekil 4.20 Ya in Yanl Snflandrmalarn Gsterimi (YSA) 97

ekil 4.21 PSA in Yanl Snflandrmalarn Gsterimi (YSA) 97

ekil 4.22 Rektal Tue in Yanl Snflandrmalarn Gsterimi(YSA)

98

ekil 4.22 Genetik Yatknlk in Yanl SnflandrmalarnGsterimi (YSA)

98

xi

KISATMALAR ve SMGELER

C&RT Snflandrma ve Regresyon Aac

YSA Yapay Sinir Alar

LRA Lojistik Regresyon Analizi

ROC Receiver Operating Characteristic Curve (Alc lemKarakteristikleri Erisi)

AUC ROC erisi altnda kalan alan (Area under the ROCCurve)

VM Veri Madencilii

CHAID (Chi-Squared Automatic Interaction Detector: OtomatikKi-Kare Etkileim Belirleme),

MARS (Multivariate Adaptive Regression Splines: okDeikenli Uyumlu Regresyon Uzanmlan),

QUEST (Quick, Unbiased, Efficient Statistical Tree: Hzl, Yansz,Etkin statistiksel Aa),

SLIQ (Supervised Learning in Quest),

SPRINT (Scalable Parallelizable Induction of Decision Trees)

ID3 Iterative Dichotomiser 3

11. GR ve AMA

Gnmzde teknolojinin hzl geliimi ile tm sektrlerden elde edilen veri

miktar devasa boyutlara ulam ve verilerin toplanmas, saklanmas, ilenmesi gibi

problemler ortaya kmtr. yle ki bugn dnyadaki bilgi miktarnn her yirmi ayda

bir ikiye katland kabul edilmektedir. Bu problemlere, gelien bilgisayar teknolojileri,

kapasitesi ve ilem gc artan donanmlar ve yazlmlar ile birlikte zm sunmaya

almtr. Bu zmlerinde en nemlisi veri tabanlar alanndaki ilerlemelerdir. Ancak

veritaban sistemlerinin artan kullanm ve hacimlerindeki olaanst art, iletmeleri

toplanan verilerden nasl faydalanlabilecei problemi ile kar karya brakmtr. Veri

miktar arttka bu verilerin insanlarca anlalmas zorlam; veriler ierisinde sakl

kalm yararl bilginin elde edilmesi ve Karar Destek Sistemi erevesinde kullanm,

herhangi bir ara kullanmakszn olanaksz hale gelmitir. Geleneksel sorgu veya

raporlama aralarnn veri ynlar karsnda yetersiz kalmas, veri madencilii ve veri

madencilii altnda yaplan snflandrmalar gibi yeni araylara neden olmaktadr [1, 2,

3].

Snflandrma uygulamalarnda kullanlan pek ok model ve bu modellere ait

farkl algoritmalar vardr. Bu algoritmalardan hangisinin daha efektif sonular rettii,

hangi algoritmann hangi alanda daha baarl olduu sorusuna verilen cevaplar

uygulamalarn baarmn arttracak ve yaplan iin verimini arttracaktr. Bu sebeple

algoritmalarn karlatrlarak deerlendirilmesi byk nem arz etmektedir. ok

sayda algoritma olmas, her algoritmann kendi iinde farkl parametrelerle almas,

her algoritmann birden ok versiyonunun bulunmas, farkl algoritmalarn farkl amaca

ynelik olmas, kullanlan veri kaynann farkl olmas, algoritmalarn farkl veri

2tiplerini desteklemesi ve veri zerinde yaplan nilemlerin uygulaycya bal olmas

gibi sebeplerle farkl sonular elde edilmitir [1, 2, 4, 12, 13, 15].

Baml deikenlerin kategorik yapda olduu veri setlerinin analizinde

bamsz deikenlerin baml deiken zerindeki etkilerini deerlendirmek ve

birimlerin baml deikenin kategorilerine gre en az hata ile snflandrlmas iin

kullanlan Snflandrma ve Regresyon Aalar (C&RT); Yapay Sinir Alar (YSA) ve

Lojistik Regresyon Analizi (LRA) yntemlerinin karlatrlmas yaplm ve

birbirlerine gre avantaj ve dezavantajlar incelenmitir. Yntemlerin karlatrlmas

iin gerek bir veri seti ve karlatrma iin ak kaynak koda sahip bir istatistik

program olan Weka (Waikato Environment for Knowledge Analysis Ver.3,6,5)

program kullanlmtr.

Snflandrma ve Regresyon Aalar (C&RT); ikili karar aac oluturan bir

yntemdir. Aataki her bir noda, her bir bamsz deiken iin geliim skoruna dayal

olarak en iyi kesim noktas ya da en iyi kategori gruplar oluturulur. Snflandrma ve

Regresyon Aalarnda ama baml deiken ile ilgili verilerin mmkn olduunca

homojen alt setlerinin meydana getirilmesidir. C&RT, kategorik yapdaki baml

deikenler iin genellikle Gini indeksi kullanarak en iyi kestirici deiken seerek aa

yapsn oluturur [3, 4, 14].

Yapay Sinir Alar insan beynindeki sinir alar gibi alarak elle zm

olana vermeyen son derece karmak yapya sahip problemlerin zmn salayan

ve deiken yaps konusunda herhangi bir kstlama getirmeksizin deikenler aras

ilikiyi ortaya koyan ok esnek bir yntemdir. YSA, zellikle snflandrma problemleri

iin yaygn ekilde kullanlmaktadr. YSA, geriye yaylma algoritmasn kullanarak a

3hatasn minimize ederek birimlerin en az hata ile snflarna atanmas iin an

arlklarn adm adm hesaplar [5 ,6, 7, 16, 18].

Lojistik Regresyon Analizi ise baml deikenin kategorik ve bamsz

deikenlerin kark lekli olmas durumunda belirli bir dalm varsaymna baml

kalmakszn baml deiken ile bamsz deikenler arasndaki neden-sonu

ilikisinin belirlenmesinde kullanlan bir yntemdir. LR, en ok olabilirlik tahmin

yntemini kullanarak veri setinden elde edilen olasl maksimum yapan bilinmeyen

parametre deerleri tahmin eder. Bylece olabilirlik fonksiyonunu maksimum yapan

parametre tahminleri seilir ve gzlenen veri ile en iyi rten parametre tahminleri elde

edilir [3, 4, 17].

Literatr taramas yapldnda bu almada seilen snflandrma

ynteminin genellikle ikili varyasyonlar ile karlalmtr. Tarama sonucunda gncel

almalar tercih edilmi olup bunlardan bazlar aada zetlenmitir.

Gneri ve ark.[4] baar snflandrmasnda lojistik regresyon ve sinir alar

yaklam sonucunda elde edilen doru snflandrma oranlarn karlatrdklarnda

verilerin doru snflandrma olaslklar lojistik regresyon uygulamas ve sinir alar

yaklam iin %95.17 olarak bulunmutur. ki yntemin ayn sonucu vermi olmas

sinir alarnn atama problemlerinde kullanlabilirliini gstermitir.

Kurt ve ark.[5] yapt almada, rencilerin alkol kullanmn etkileyen

faktrler lojistik regresyon analizi (LR) ve yapay sinir alar (YSA) ile incelenmitir.

Bu yntemlerin alkol kullanan ve kullanmayan rencileri ayrmadaki etkinlikleri ROC

erisi yntemiyle karlatrlm. Sonu olarak LR, modelin parametre tahminleri ve

OR deerleri hakknda bilgi vermesi ve sonularnn kolay yorumlanabilir olmas

asndan YSAdan daha avantajl olduu grlmtr. Bu nedenle eer uygulama

4sonucunda YSAnn snflandrma performans LRden kt ise LR modeli tercih

edilmeli; eer YSAnn performans LRden daha iyi ise nemsiz deikenlerin

modelden karlmasnda LR, YSA iin bir n eleme yntemi olarak kullanlmaldr

sonucuna varlmtr.

Ocakolunun[6] yapt almada, lojistik regresyon analizi ve yapay sinir

alarnn snflama etkinliklerini karlatrmay amalamaktadr. Lojistik regresyon

analizi ve yapay sinir alar yntemleri, bireylerin snflandrma oranlarna gre

karlatrlmtr. Buna gre YSA modelleri ile snflandrmann LRA kullanlarak

yaplan snflandrmadan daha iyi sonular verme eiliminde olduu ayrca yine ar

eitme, mimarinin hatal oluturulmas vb. problemleri olmayan YSA modellerinin daha

iyi ngr performans salayabildii grlmtr.

Karakn[7] yapt almada, meme kanseri hastalarnn koltuk alt lenf nod

durumlarn belirleyen SLNB ve AD ameliyatlar olmakszn, her hastanede kolaylkla

elde edilebilir olan klinik ve patolojik verilerinin girildii YSA nn, hastalarn koltuk

alt lenf nod durumunu belirlemesi amalanmtr. alma iin Ankara Numune Eitim

ve Aratrma Hastanesi ve Ankara Onkoloji Eitim ve Aratrma Hastanesine bavuran

ve meme kanseri 270 kiinin verileri kullanlmtr. ok katmanl ileri yaylml yapay

sinir a modeli sonular regresyon ve korelasyon katsaylarna baklarak

deerlendirilmitir. Ayn zamanda tbbi almalarda tp testlerinin doruluklarn tespit

amal kullanlan ROC analizi ile elde edilen eitim ve test veri sonularnn belirlilik,

duyarllk ve doruluk sonular deerlendirilmitir. YSAnn sonularnn kyaslanmas

iin lojistik regresyon yntemi kullanlmtr. Lojistik regresyon ile hangi verilerin

anlaml olduuna baklm, anlaml olan verilerle yapay sinir a tekrar eitilmi ve test

5edilmitir. Lojistik regresyon ve seilen YSA modelleri kyaslandnda YSA deerleri

daha baarl olduu grlmtr.

Krann[8] yapt almada, veri madencilii yntemleri ierisinde snflama

ve regresyon modellerinden en ok kullanlan karar aalar ile lojistik regresyonun

snflama zellikleri karlatrlarak gerek bir veri seti zerinde uygulama yaplm ve

sz konusu iki yntemin baarsn gstermek amalanmtr. Sonuta her iki modelin %

90n zerinde snflandrma baars gsterdii dikkat ekerken, C&RT ynteminin

daha yksek snflandrma baarsna sahip olduu tespit edilmitir. Bu noktadan

hareketle C&RT ve lojistik regresyon analizi ile yaplan almalarda hata riskini en aza

indirmek amacyla C&RT ynteminin kullanlmas daha uygun bulunmutur.

King ve ark.[39] sembolik renme (C&RT, C4.5, NewID, ITrule,Cal5, CN2),

istatistik (Naive Bayes, k-en yakn komuluk, kernel younluk, dorusal ayrma, karesel

ayrma, lojistik regresyon, Bayes Alar) ve yapay sinir alar (geri yaynm - merkez

tabanl uzaklk fonksiyonu) yntemleri arasnda karlatrma yapmlardr. Bu

yntemleri be adet resim, iki adet tp, ikier mhendislik ve finans veri kmeleri

zerinde uygulamlardr. Daha iyi sonular reten algoritmann, zerinde aratrma

yaplan veri kmesine bal olduu sonucuna ulamlardr ve rnek olarak iki

kategorili deikenlerde gzlenme orannn %38in zerinde olduu veri kmelerinde

sembolik renme algoritmalarnn daha verimli sonular rettiini belirtmilerdir.

Sabzecari ve ark.[10] zel bir bankann kredi derecelendirme amal veri kmesi

zerinde uyguladklar veri madencilii yntemlerini karlatrmlardr. Bankalar,

kredi verirken, veri madencilii yntemleri ile kredi bavurusunda bulunan mterileri

deerlendirerek mteriye kredi verilmesinin uygun olup olmadn belirlemektedirler.

Sabzecari ve ark. Probit ve lojistik regresyon, C&RT, yapay sinir alar, bagging ve

6MARS algoritmalarn karlatrarak sonularn deerlendirmilerdir. Olduka kk

bir veri kmesi zerinde yaptklar bu alma sonucunda istatistiksel modeller

arasndan lojistik regresyon ve makine renme modelleri arasndan da bagging

modelinin daha baarl sonular rettiini ifade etmilerdir.

Zurada ve ark.[11] salk endstrisinde kt kredilerin belirlenmesinde

karlatrdklar yapay sinir alar, karar aalar, lojistik regresyon, hafza-tabanl

sebepleme ve btnletirilmi model arasnda karlatrlma yapmlardr. Sonuta

yapay sinir alarnn, lojistik regresyon algoritmasnn ve btnletirilmi modelin daha

iyi kesinlik oranna sahip sonular rettiini, karar aalarnn ise iyi kredi

snflandrmasn daha yksek bir doruluk derecesiyle tespit ettiini belirtmilerdir.

72. GENEL BLGLER

Veri Madenciliinde kullanlan modeller, temel olarak ekil 2.1de grld

zere tahmin edici (predictive) ve tanmlayc (descriptive) olmak zere iki ana balk

altnda incelenmektedir [26].

ekil 2.1. Veri Madencilii Modelleri

Tahmin edici modellerin amac, verilerden hareket ederek bir model gelitirmek

ve kurulan bu model yardmyla sonular bilinmeyen veri kmelerinin sonu

deerlerini tahmin etmektir. Eer tahmin edilecek deiken srekli bir deikense

tahmin problemi regresyon, kategorik bir deikense snflama problemi olarak

nitelendirilmektedir [2]. Tanmlayc modellerde ise karar vermeye rehberlik etmede

kullanlabilecek mevcut verilerdeki rntlerin tanmlanmas salanmaktadr.

Veri Madencilii modelleri fonksiyonlarna gre ise;

Snflama (Classification) ve Regresyon,

Kmeleme (Clustering),

8 Birliktelik kurallar (Association Rules) eklinde snflandrlmaktadr.

ekil 2.1de gsterilen veri madencilii modellerinden snflama ve regresyon

modelleri tahmin edici, kmeleme, birliktelik kurallar ve ardk zamanl rntler ise

tanmlayc modellerdir [1].

2.1. SINIFLAMA VE REGRESYON MODELLER

Veri madencilii yntemleri ierisinde en yaygn kullanma sahip olan, byk

veri kmelerini snflandrarak nemli veri snflarn ortaya koyan veya gelecek veri

eilimlerini tahmin etmede faydalanlan yntemlerden bir tanesi snflama ve regresyon

modelleridir.

Veri madenciliinin en nemli alanlarndan biri olan kmeleme, nesneleri

birbirlerine olan benzerliklerine gre gruplara ayrmaktadr. Yani kmeleme

modellerinde ama, kme yelerinin birbirlerine ok benzedii ancak zellikleri

birbirlerinden ok farkl olan kmelerin bulunmas ve veri tabanndaki kaytlarn bu

farkl kmelere blnmesidir. Bylece nesneler, rneklenen kitle zelliklerini iyi

yanstan etkili bir temsil gcne sahip olacaktr [1,2,3].

Snflama en ok bilinen veri madencilii yntemlerinden birisidir; resim, rnt

tanma, hastalk tanlan, dolandrclk tespiti, kalite kontrol almalar ve pazarlama

konulan snflama yntemlerinin sklkla kullanld alanlardr. Snflama tahmin edici

bir model olup, havann bir sonraki gn nasl olaca veya bir kutuda ka tane mavi top

olduunun tahmin edilmesi bir snflama ilemidir [27]. Matematiksel olarak snflama;

D = {t1,t2,...,tn} bir veri taban ve her bir ti bir kayt (gzlem),

C = {Cl,C2,...,Cm} ise m adet snftan oluan snflar kmesini temsil etmek

zere,

9 f : D C ve her bir ti bir snfa dahildir. Ayrca her bir Cj ayr bir snftr ve her

bir snf kendisine ait kaytlar ierir. Yani,

C j = { t i l f { t i ) = C j,\

10

belli bir veri zellii seilerek algoritmann bu kt zellii deerlerine ulamak iin

hangi girdi zelliklerinin bir arada olmas gerektiini aa veri yaplar eklinde

kefetmesi salanr [28].

Karar aalar, basit karar verme admlar uygulanarak, ok sayda kayt ieren

bir veri kmesini ok kk kayt gruplarna blmek iin kullanlan bir yapdr [29].

Her baarl blme ilemiyle, sonu gruplarnn yeleri bir dieriyle ok daha benzer

hale gelmektedir.

Bu teknikte snflandrma iin bir aa oluturulur, daha sonra veri tabanndaki

her bir kayt bu aaca uygulanr ve kan sonuca gre de bu kayt snflandrlr. Karar

aalar veri setinin ok karmak olduu durumlarda bile, baml deikeni etkileyen

deikenleri ve bu deikenlerin modeldeki nemini basit bir aa yaps ile grsel

olarak sunabilmektedir [8,28].

Karar aac yntemini kullanarak verinin snflanmas temel olarak iki admdan

olumaktadr. Birinci adm; nceden bilinen bir eitim verisinin model oluturmak

amac ile snflama algoritmas tarafndan zmlendii renme basamadr.

renilen model, snflama kurallar veya karar aac olarak gsterilir. kinci adm ise

eitim verisinin snflama kurallarnn veya karar aacnn doruluunu belirlemek

amacyla test edilerek kullanld snflamadr. Eer doruluk kabul edilebilir oranda

ise, kurallar yeni verilerin snflanmas amacyla kullanlr [8].

Karar aac algoritmalarn bir probleme uygulayabilmek iin aadaki

koullarn salanmas gerekir:

Olaylarn zelliklerle ifade edilebilmesi gerekir. Nesnelerin belli sayda zellik

deerleriyle ifade edilebilmesi gerekir. rnein; souk, scak vb. zelliklerin

srekli ve ya kesikli olmas fark etmez.

11

Snflar belirleyebilmek iin gereken ayrc zelliklerin olmas gerekir. Karar

aac, adnda belirtildii ekilde aa grnmnde bir tekniktir. Karar

dmleri, dallar ve yapraklardan oluur [19].

Karar aalarnn kk, dallar ve yapraklardan oluan aaca benzeyen bir yaps

olup, rnekteki tm gzlemleri kapsayan bir kk ile balayp aaya doru inildike

veriyi alt gruplara ayran dallara ayrlrlar. Bu kkten dallara doru byyen aa

yapsnda her boum dm dr, oluan aalarda homojen olmayan dmlere

yavru dm (child node), homojen dmlere ise terminal dm (parent node)

ad verilir [30]. Dmler zerinde niteliklerin test ilemi yaplmakta ve test ileminin

sonucu aacn veri kaybetmeden dallara ayrlmasna neden olmaktadr. Her dmde

test ve dallara ayrlma ilemleri ardk olarak gereklemekte ve sonu olarak aa

snflar ile son bulmaktadr.

Dm: Veriye uygulanacak test tanmlanr. Her dm bir zellikteki testi

gsterir. Test sonucunda aacn dallar oluur. Dallar olutururken veri kayb

yaanmamas iin verilerin tmn kapsayacak sayda farkl dal oluturulmaldr.

Dal: Testin sonucunu gsterir. Elde edilen her dal ile tanmlanacak snfn

belirlenmesi amalanr. Ancak daln sonucunda snflandrma tamamlanamyorsa tekrar

bir karar dm oluur. Karar dmnden elde edilen dallarn sonucunda

snflandrmann tamamlanp tamamlanmad tekrar kontrol edilerek devam edilir.

Yaprak: Daln sonucunda bir snflandrma elde edilebiliyorsa yaprak elde

edilmi olur. Yaprak, verileri kullanarak elde edilmek istenen snflandrmann

snflarndan birini tanmlar [30].

Karar aacnda, tanmlanm olan soruya ilikin cevap gruplara ayrlmaktadr.

Cevaplar soruya verilecek bir lt belirlendikten sonra setler arasndaki riski

12

maksimize edecek ekilde blnmekte ve en iyi blnmeyi bulmak iin her soruda ayn

ilem tekrar edilmektedir. Bir soru iin grup oluturulduktan ve gruplar arasndaki risk

maksimize edildikten sonra oluan iki grup iin bu ilemler devam ettirilmektedir. Bu

ilemlere istatistiksel olarak anlaml bir fark bulunana kadar devam edilmekte,

istatistiksel olarak anlaml bir fark bulunmadnda ise son verilmektedir. Ayrtrma

ilemi tamamlandktan sonra ise o grup ierisinde yer alan gzlemlerin oranna gre

grup deerlendirilmektedir [31].

Karar aalarnn oluturulmas aa oluturma ve aa budama

basamaklarndan oluur.

Aa oluturma: Veri kaynandaki btn nesneleri ieren kk dmden

balar, yinelemeli olarak her dmde var olan nesneleri seilecek olan bir nitelie gre

farkl dallara ayrarak btn nesneleri snflandracak ekilde yaprak dmlere blene

kadar, ya da ayrm yapc bir nitelik kalmayana kadar devam eder. Snama

dmlerinde eldeki nesnelerin hangi nitelie gre alt dmlere blndnde en ok

verimin alnacan bulmak ve dallanmay bu nitelie gre yapmak algoritmann gcn

arttrr. Nesneler alt dmlere blndnde alt dmlerdeki nesnelerin trdelii ne

kadar yksek olursa o dmdeki dallanma o kadar verimli olur. Bu sebeple, her

dmde, snamas yaplacak olan nitelik (o dmdeki nesneleri alt dmlere

bldnde) homojenite bakmndan en yksek kazanc salayacak nitelik olarak seilir

[8,31].

Aa Budama: Aa oluturma basama, verileri tamamen ayn snf

yelerinden oluan yapraklara blnceye ya da karlatracak nitelik kalmayncaya

kadar blmeler. Bu algoritmann sonucu olarak, ok derin ya da ok az deneme kmesi

rnei ieren yaprak dmlere sahip aalar oluabilir. Byle bir aac renme

13

kmesi zerinde test edince elbette ki doruluu ok yksek sonular verir. Ancak

byle bir model henz grlmemi rneklerle karlarsa ok kt doruluklu sonular

retebilir. Byle bir model verimli deildir ve veriyi genellemekten uzaktr. Byle bir

modelin sahip olduu bu zellie ar uyum (overfitting) denir. Ar uyum bir

modelde istenmeyen bir sonutur [27,31].

An uyum genelde verideki grltden (hatal snf deeri, yanl deerli

deikenler) kaynakland gibi problem alannn karmaklndan ya da rastgelelikten

kaynaklanabilir.

Ar uyumu azaltmak iin aalarda budama ilemi uygulanr. Budama ilemi,

baz dallarn ya da alt dallarn kaldrlarak o dala ait nesnelerin youn olduu snfla

etiketlenmi yaprak dmlerle yerletirilmesiyle gerekletirilir. Aa oluturulurken

erken-dur yntemiyle erken-budama yaplabilecei gibi aa oluturulduktan sonra

budama ge-budama yaplabilir. Ge-budama ynteminin daha baarl olduu

bilinmektedir. Zira erken-budama yntemi hatal sonulara yol aabilir, nk henz

dallanma yaplmam bir dal budandnda, aacn o noktadan sonra ne ekil alm

olaca o aamada bilinmemektedir. Ancak ge-budama yaplrken aa zaten olumu

bulunmaktadr ve hangi dallarn aslnda gereksiz olduu, an uyum yaratt

bilinmektedir. Ge-budama yaplrken dmlerdeki beklenen hata deerine baklr.

Eer bir dmdeki beklenen hata miktar, o dme ait alt dallardaki beklenen hata

miktarndan kk olursa alt dallar budanr [31,32].

D = {t1,...,tn} bir veri taban olmak zere, t t , t i={t1...tin} den ve bu veri taban

{A 1 ,A 2 , . . . ,A n } alanlarndan olumaktadr.

Bunun dnda C = {C1,...,C} kadar da snf verilmi olduunda,

Her bir dm At alanyla tanmlanm,

14

Her dmden ayrlan kollar bu alanla ilgili bir soruya yant veren,

Her yapran bir snf olduu karar aac ekil 2.2da gsterilmitir [27].

ekil 2.2. Karar Aac Yaps

ekil 2.2de grlen karar aacndaki A1, A2 ,..., An den her biri bir dm

oluturmakta ve her dm kendinden sonra iki dala ayrlmaktadr. Bu ayrlma ilemi

srecinde, Ai dm hakknda cevab veri tabannda bulunacak bir soru sorulmakta ve

verilen yanta gre de bir dal izlenmektedir. Aataki C1 ,C2 ,...,Cn lerin her biri birer

yapra ayn zamanda snf temsil etmektedirler.

Karar aalar oluturulurken kullanlan algoritmann ne olduu nemli bir

husustur. Kullanlan algoritmaya gre aacn ekli deiebilir. Bu durumda deiik aa

yaplar da farkl snflandrma sonular verecektir. Kk denilen ilk dm oluturan

Ai nin farkl olmas, en utaki yapraa ularken izlenecek yolu ve dolaysyla

snflandrmay da deitirecektir [27].

15

Deikenlerin seiminde yinelemeli olan algoritmann dngden kmas iin o

dmdeki tm elerin ayn snfa dhil olmas art vardr. Eer kalan deerler sadece

bir snfa aitse veya snflandrlabilecek deer kalmadysa dngsel algoritma sonlanr

ve karar aac oluturulmu olur. Sonuta oluan snflardaki her bir eleman ayn snfn

dier elemanlar ile benzer zellikler gsterir. Aa yaps heterojen yapdaki veri

kmesinin daha kk ve homojen bir yapya dnmesi iin kurallar tanmlar. Aa

inas sonunda elde edilen aa maksimum aa olarak adlandrlr ve renme

kmesindeki deney nitelerine en uygun aatr. Ancak maksimum aa pratikte iki

dezavantaja sahiptir [32].

Maksimum aa balang veri setini (renme kmesini) kusursuz biimde

tanmlar nk eklenen her bamsz deiken hatal snflama orann drr.

Bu durumda, maksimum aa veri iin olmas gerekenden daha iyi bir tahmin

modeli sunar. Ancak, balang veri setine ar uyumlu maksimum aalar

farkl bir veri seti sz konusu olduunda iyi bir tahmin salayamazlar.

Bir snflama aacnn karmaklk ls o aacn terminal dm saysna

eittir. Terminal dm saylar ve dolaysyla karmakl yksek olan

maksimum aacn anlalmas ve yorumlanmas gtr.

Maksimum aacn pratikte ortaya kard bu sorunlarn zm iin

maksimum aacn budanmas gereklidir. Maksimum aacn budanmas daha kk

aalar dizisi oluturur ve oluturulan bu dizi ierisinden optimum aa seilir.

Optimum aa maksimum aatan daha az karmakla sahiptir ancak renme

kmesine maksimum aatan daha az uyumludur ve hatal snflama oran da daha

yksektir [27,31,32].

16

Karar aacnn kurulmas iin kullanlacak girdi olarak bir dizi kayt verilirse bu

kaytlardan her biri ayn yapda olan birtakm zellik/deer iftlerinden oluur. Bu

zelliklerden biri kaydn hedefini belirtir. Ama, hedef-olmayan zellikler kullanlarak

edef zellik deerini doru kestiren bir karar aac belirlemektir. Hedef zellik

ounlukla sadece {evet, hayr}, veya {baarl, baarsz} gibi ikili deerler alr [19].

Bir karar aac ne bildiimizi (rn., renme verisi) zetledii iin deil, yeni

durumlarn snflamasn doru yapt iin nemlidir.

Karar aac tekniini kullanarak verinin snflanmas aamadan oluur.

renme: nceden sonular bilinen verilerden (eitim verisi) model

oluturulur.

Snflama: Yeni bir test verisi kmesi modele uygulanr, bu ekilde karar

aacnn doruluu belirlenir. Test verisine uygulanan bir modelin doruluu,

yapt doru snflamann test verisindeki tm snflara orandr. Her test

rneinde bilinen snf, model tarafndan tahmin edilen snf ile karlatrlr.

Uygulama: Eer doruluk kabul edilebilir oranda ise, karar aac yeni verilerin

snflanmas amacyla kullanlr [33].

Test verisini en iyi ekilde dallara ayran zellik tespit edilerek, bu zellik karar

aacnn oluturulmasnda daha nce seilir. Bylece daha iyi bir karar aac

oluturulur. En iyi dallara ayran zelliin tespitinde eitli ltler gelitirilmitir.

Bu ltlerin baz rnekleri unlardr:

p(i | t), i snfna ait verilerin, verilen bir t dmndeki blnmesini gstersin.

c snf saysdr ve entropi hesaplamasnda 0 log2 0 = 0 eklinde dnlmtr.

c-1

Entropi(t) = p(i | t) log2p(i | t), (2.1)

17

i=0

Entropi bir dmn ne kadar bilgi verici olduunu lmede kullanlr. Bu yi

ile ne kastedildiini belirtir. Bu kavram Claude Shannon tarafndan ilk kez Bilgi Teorisi

iinde tanmlanmtr.

c-1

Gini(t) = 1 [p(i | t)]2, (2.2)

i=0

Snflandrma hatas(t) = 1 maxi[p(i | t)],

Karar aac oluturulduktan sonra, kkten yapraa doru inilerek kurallar

belirlenir. Ancak ok sayda dal ve dmden oluan karar aalarnda kurallarn

belirlenmesi zorlar. Karar aac modelini daha okunabilir hale getirmek iin kurallarn

yazmnda IF-THEN (Eer-ise-O Zaman) biiminde artl ifadeler kullanlr. IF (Eer-

ise) ksm daln sonuna giden yol zerindeki tm testleri ierirken THEN (O Zaman)

ksm son snflamay gsterir. IF THEN yapsndaki kurallara Karar Kurallar (Decision

Rules) denir [18,22].

Karar aalar, model kurulumu ve sonularnn yorumlanmasnn kolay olmas,

veritaban sistemleri ile kolayca entegre edilebilmeleri ve gvenilirliklerinin iyi olmas

nedenleri ile snflama modelleri ierisinde en yaygn kullanma sahip tekniktir [34].

Karar aalarnn gl ynleri aadaki gibi zetlenebilir:

Karar aalar anlalabilir kurallar retirler.

Karar aalar ar hesaplamaya gerek kalmadan snflandrma yaparlar.

Karar aalar hem srekli ve hem de kesikli deikenler iin uygundur.

Karar aalar snflandrma ve kestirim iin hangi alanlarn en nemli

olduunu ak biimde gsterir [35].

18

Karar aalarna dayal olarak gelitirilen birok algoritma vardr. Bu

algoritmalar kk, dm ve dallanma kriteri seimlerinde izledikleri yol asndan

birbirlerinden ayrlrlar. Karar aac oluturmak iin gelitirilen bu algoritmalar

arasnda;

CHAID (Chi-Squared Automatic Interaction Detector: Otomatik Ki-Kare

Etkileim Belirleme),

C&RT (Classification and Regression Trees: Snflama ve Regresyon Aalar),

MARS (Multivariate Adaptive Regression Splines: ok Deikenli Uyumlu

Regresyon Uzanmlar),

QUEST (Quick, Unbiased, Efficient Statistical Tree: Hzl, Yansz, Etkin

statistiksel Aa),

SLIQ (Supervised Learning in Quest),

SPRINT (Scalable Parallelizable Induction of Decision Trees)

ID3, C4.5 ve C5.0 yer almaktadr.

2.1.2. Yapay Sinir Alar

nsanlarn beynin almasn saysal bilgisayarlar zerinde taklit etmek istemesi

sonucunda yapay sinir alar ortaya kmtr. Temelde beynin alma yaps, insanlar

gibi dnen ve renen sistemler elde etme fikrinin olmas, almalar insan beynini

oluturan hcrelerin incelenmesi zerine younlatrmtr. Bu almalar esnasnda her

bir nronun dier nronlar ile ilikili olduu ve ald baz girdileri ktya

dntrd gzlemlenmitir. Gnmzde yapay sinir alan olarak adlandrlan bu

alan, birok nronun belirli kurallar erevesinde bir araya gelerek bir ilevin

19

gerekletirmesi esnasndaki yapsal, matematiksel ve felsefi sorunlara cevap bulmaya

alan bir bilim dal olmutur [45].

YSA kavram beynin alma ilkelerinin saysal bilgisayarlar zerinde taklit

edilmesi fikri olarak ortaya km ve ilk almalar beyni oluturan biyolojik

hcrelerin, ya da literatrdeki ismi ile nronlarn matematiksel olarak modellenmesi

zerinde younlamtr [46].

Yapay sinir a, beynin belirli bir ii veya fonksiyonu yerine getirme yntemini

modelleyen bir makinedir. An yaps, elektronik sistemler veya bilgisayar yazlmlar

ile tanmlanmaktadr. Tanmlanan bu model, sinir hcresi veya ilem birimi ad verilen

hcreler arasndaki balanty kullanmakta ve bu ilemler esnasnda renme ad verilen

bir sre ile performansn artrabilmektedir. Bu noktada yapay sinir a kavramn

deneysel bilgi saklama ve kullanma hazr hale getirme yeteneine sahip basit ileme

birimlerinden oluan, ok youn, paralel ve datlm dzende alan bir ilemci

olarak tanmlamak mmkndr. nsan beyni ile benzerlii ise bilgiyi renme yoluyla

elde etmesi ve bilginin depolanmas iin sinir hcreleri aras ba kullanmasdr [47].

2.1.2.1. Yapay Sinir A Nedir?

Bir yapay sinir a, biyolojik sinir alarnn karakteristiklerine benzer

karakteristiklere sahip bir bilgi ileme sistemidir. YSA, insann idrak etmesi ve

biyolojik nron yapsnn matematiksel modelinin aadaki kurallar varsaylarak

genelletirilmesi sonucunda oluturulmutur [48]:

Bilgi ileme, nron ad verilen birok basit elemanlarda gerekleir;

Sinyaller, nronlar arasndaki ilikiyi salayan balantlarla iletilir;

20

Her bir balantnn bir arlk deeri vardr ve bu deer, gerek nronlarda

olduu gibi sinyal geiini retmektedir;

Sinir a iindeki her bir nrona ayn bir aktivasyon fonksiyonu uygulanr

(genelde bu dorusal olmayan bir fonksiyondur) ve bu fonksiyonun k deeri

sayesinde nronun k sinyali hesaplanr;

Herhangi bir yapay sinir a;

Nronlar arasndaki bantnn bir modeli yani mimarisi ile,

Balantlardaki arlklarn hesaplanmas (bu hesaplama, eitim kural ya da

renme algoritmas olarak da adlandrlr) ile,

Aktivasyon fonksiyonu ile tanmlanabilir.

Yapay sinir alarnn karakteristik zellikleri uygulanan a modeline gre

deimektedir. Ancak tm modeller iin genel zellikler unlardr: [49]

Yapay sinir alar makine renmesi gerekletirirler.

Programlar alma stili bilinen programlama yntemlerine

benzememektedirler.

Bilgiyi saklarlar.

rnekleri kullanarak renirler.

Gvenle altrlabilmeleri iin nce eitilmeleri ve performanslarnn test

edilmesi gerekmektedir.

Grlmemi rnekler hakknda bilgi retirler. Bunu genelleme zellii sayesinde

yaparlar.

Alglamaya ynelik olaylarda kullanlabilirler.

ekil ilikilendirme ve snflandrma yapabilirler.

21

rnt tamamlama gerekletirebilirler.

Kendi kendine organize etme ve renebilme yetenekleri vardr.

Eksik bilgi ile alabilmektedirler.

Hataya ve grltye kar duyarlla ve toleransa sahiptirler.

Belirsiz, tam olmayan bilgileri ileyebilmektedirler.

Dereceli bozulma (Graceful degradation) gsterirler.

Datk bellee sahiptirler. Veri datlm birleik hafza yaps kullanlr ve

bilgi farkl formlara dntrlerek ilenebilir.

Sadece nmerik bilgiler ile alabilmektedirler [49,50].

Bir yapay sinir a, nron, birim, hcre ya da dm olarak adlandrlan ok

saydaki basit ilem birimlerinden oluur. Her bir nron, dier bir nrona belli bir

arlk deerine sahip olan haberleme balantlaryla balanr. Arlklar, yapay sinir

ann bir problemi zmesi iin gerekli olan bilgiyi hazrlamaktadr. YSA ok eitli

problemlerin zmnde kullanlabilirler. rnek olarak, bilgileri ve numuneleri

saklamada ve onlar daha sonra tekrar tanmada, numuneleri snflandrmada, giri

numunelerinin k numunelerine dntrlmesinde, benzer rneklerin

gruplandrlmasnda ya da doal olmayan optimizasyon problemlerinin zmlerinin

bulunmasnda ve daha pek ok alanda YSA ok geni bir biimde kullanlabilir [50].

rnek olarak ekil 2.3de gsterilen bir Y nronunu dnelim. Bu nron X1,X2

ve X3 nronlarndan giri sinyallerini alr. Bu nronlarn aktivasyonlar yani k

sinyalleri, srasyla x1,x2 ve x3 tr. Balantlar zerindeki arlklar X1,X2 ve X3

nronlarndan Y nronuna doru srasyla w1,w2 ve w3 tr. A girii olan y _ in deeri

22

X1,X2 ve X3 den Yye giden arlkl sinyallerin toplamdr. y _ in deeri aadaki

eitlikteki gibi hesaplanr [50].

y _ in=w1x1+ w2x2+ w3x3 (2.3)

ekil 2.3. Basit Bir Yapay Nron

Y nronunun aktivasyonu y, aa giri deerlerinin bir fonksiyonu olarak

tanmlanr.

y=f(y _ in)

Bu fonksiyon, S-biimli sigmoid fonksiyon olabilir. Sigmoid fonksiyonun formu

aada verildii gibidir.

1( )1 exp( )

f xx

= + - (2.4)

Bu fonksiyonu, dier aktivasyon fonksiyonlarndan biri de olabilir.

23

Y nronunun Z1 ve Z2 nronlarna v1 ve v2 arlklaryla baland

varsaylsn. Bu durum, ekil 2.4de gsterilmektedir. Y nronu y sinyalini dier

birimlere gnderir. Bununla birlikte, genel olarak Z1 ve Z2 nronlar tarafndan alnan

sinyaller farkl olmaktadr; nk her bir sinyal aktarld balantda bulunan v1 ve v2

arlklar ile orantldr. Z1 ve Z2 nin aktivasyonlar olan z1 ve z2 deerleri, sadece tek

bir nrona bal deildir. Onlar birbirinden farkl birden fazla nrondan gelen sinyallere

baldr.

ekil 2.4 deki yapay sinir a basit olmasna ramen, gizli birimin grnm ve

dorusal olmayan aktivasyon fonksiyonu sayesinde birok problemi zebilir. Baka bir

ynden gizli bir birime sahip yapay sinir ann retilmesi yani arlklarn optimal

deerlerinin bulunmas olduka zordur [6].

ekil 2.4. Basit Bir Yapay Sinir A [6]

24

2.1.2.2. Biyolojik Sinir Alar

ekil 2.5. Biyolojik Sinir Sisteminin Blok Gsterimi

Biyolojik sinir sistemi verinin alnmas, yorumlanmas ve karar retilmesi gibi

ilevlerin yrtld beyni merkezde bulunduran 3 katmanl bir yapdr. Uyarlar alc

sinirler ile birlikte elektriksel sinyallere dntrlerek beyne iletilir. Beynin

oluturduu ktlar ise, tepki sinirleri tarafndan belirli tepkilere dntrlr.

ekil 2.6. Biyolojik Sinir Hcresi [5,47]

Sinir a yapsnda bilgilerin alc ve tepki sinirleri arasnda ileri ve geri

beslemeli olarak deerlendirilmesi ve sonucunda tepkilerin olumas, kapal bir evrim

srecine benzemektedir. Temel ilem eleman sinir hcreleridir. nsan beyninde

25

yaklak 10 milyar sinir hcresi olduu tahmin edilmektedir. ekil 2.6 da gsterildii

gibi sinir hcreleri; hcre gvdesi, gvdeye giren alc lifler (dentrit) ve gvdeden kan

sinyal iletici lifler (akson) olmak zere 3 temel bileenden meydana gelir.

Dentritler aracl ile bilgiler dier hcrelerden hcre gvdesine iletilir.

Hcrelerde oluan ktlar ise akson yardm ile bir dier hcreye aktarlr. Aktarmn

gerekletii bu noktada aksonlarda ince yollara ayrlabilmekte ve dier hcrenin

dentritlerini oluturmaktadrlar. Akson-dentrit bantsn olutuu bu noktalara sinaps

ad verilir [5,47].

Sinapsa ulaan ve dentritler tarafndan alnan bilgiler genellikle elektriksel

darbelerdir, fakat bu bilgiler sinapstaki kimyasal ileticilerden etkilenirler. Hcrenin

tepki oluturmas iin bu tepkilerin belirli bir srede belirli seviyeye ulamas

gerekmektedir. Bu deer eik deeri olarak adlandrlr [23,47].

YSAlar, insan beyninin alma prensibi rnek alnarak gelitirilmeye

allmtr ve aralarnda yapsal olarak baz benzerlikler vardr [52]. Bu benzerlikler

Tablo 2.1de ve istatistiksel terimler yapay sinir alar terimleri arasndaki terminolojik

ilikiler de Tablo 2.2 de verilmitir [50].

Tablo 2.1. Biyolojik Sinir Hcresi

Sinir Sistemi Yapay Sinir A

Nron lemci Eleman

Dentrit Girdiler

Hcre Gvdesi Transfer Fonksiyonu

Akson Yapay Nron k

Sinaps Arlklar

26

Tablo 2.2. statistiksel Yntemler le Yapay Sinir Alarnn Benzeimi

statistik Yapay Sinir A

Model A

Tahmin renme

Regresyon Danmal renme

nterpolasyon Genelletirme

Gzlem renme Algoritmas

Parametre A Parametreleri

Bamsz Deiken Giri Verileri

Baml Deiken k Verileri

Snr Regresyonu Arlk Budama lemi

2.1.2.3. Yapay Sinir Alarnda Genel Yap

ekil 2.7. Yapay Sinir Alarnn Genel Yaps

27

Girdi Katman: Girdi katman en az bir girdi elemannn bulunduu blmdr.

Girdi katmannda veriler herhangi bir ileme tabi tutulmadan girdileri ile ayn deerde

kt retirler.

kt Katman: kt katman en az bir ktdan oluur ve kt a yapsnda

bulunan fonksiyona baldr. Bu birimlerde girdi katmannda olann aksine ilem

gerekletirilir ve birimler kendi ktlarn retirler.

lem Katman: Genellikle "Kara Kutu" olarak adlandrlr. Girdi birimlerinin

belirli ilemlere tabi tutulduu blgedir. Seilen a yapsna gre ilem katmannn

yaps ve fonksiyonu da deiebilir. Tek bir katmandan oluabilecei gibi birden fazla

katmandan da oluabilir [47].

2.1.2.4. Yapay Sinir Hcresi

Biyolojik sinir alarnn yap bileenleri sinir hcreleridir benzer ekilde yapay

sinir alarnn da yapay sinir hcreleri bulunmaktadr (ekil 2.8). YSA, insan sinir

andaki gibi nronlardan ve onlar arasndaki balantlardan oluur. Bilgi, a tarafndan

bir renme sreciyle evreden elde edilir. Elde edilen bilgileri biriktirmek iin sinaptik

arlklar olarak da bilinen hcreler aras balant gleri kullanlr [53].

28

ekil 2.8 Basit Alglayc Modeli [53]

YSAya bilgi saysal olarak d dnyadan, dier hcrelerden ya da kendi

kendisinden gelebilir. Sinir hcresine bilgiler arlklar yoluyla tanrlar. Arlk

deerleri bilginin nemini ifade eder, deiken ya da sabit deerler olabilirler, pozitif ya

da negatif deerler alabilirler. Bir sinir hcresine gelen net bilgi yaygn olarak toplama

fonksiyonu araclyla hesaplanr. Her girdi deeri kendi arl ile arplr. Toplama

fonksiyonu tm girdiler iin gelen bu deerleri toplayarak net hcre ktsn hesaplar.

Her hcre dier hcrelerden bamsz olarak bu net deerini hesaplar. Sapma (bias-bk)

deerinin aktivasyon fonksiyonuna giren deeri ykseltme ya da drme etkisi vardr.

Aadaki eitlikte kullanlan xj; gelen bilgileri, wkj her girdi deerine ait arlklar, bk

sapma deerini, vk nronun kt deerini ifade etmektedir [7].

1

m

k kj j kjV w x b

== S + (2.5)

Aadaki eitlikte grld gibi her sinir hcresinin net bilgisi eik deerine

sahip bir aktivasyon fonksiyondan geirilerek gerek bir kt oluturulur. Genellikle

kullanlan aktivasyon fonksiyonlar eik, sigmoid, hiperbolik tanjant vb.

29

fonksiyonlardr. Aktivasyon fonksiyonu ((.)) genellikle dorusal olmayan bir

fonksiyondur.

( )k ky vj= (2.6)

YSA herhangi bir konu ile ilgili veri setleriyle eitilirken eitim algoritmalar

kullanrlar. renilmesi istenen olay iin oluturulan eitim seti aa sunulurken hedef

kt deerleri de aa sunulabilir. Sadece girdi seti aa sunulabilir, sistemin kendi

kendine renmesi istenilebilir ya da her girdi seti iin sistemin kendisinin bir kt

retmesi salanabilir. retilen ktnn doru ya da yanl olduunu gsteren sinyal

retilerek, bu sinyale gre sistem eitime devam edilebilir [54].

2.1.2.5. Yapay Sinir Ann Temel Elemanlar

Yapay sinir alar aadaki varsaymlar zerine kurulmutur: [55]

Bilgi ileme nron olarak isimlendiren basit elemanlarda gerekletirilir

aretler nronlar arasndaki balantlardan geer

Her balant birok iareti tayan bir arla sahiptir

Her nron kendi giri deerine k iaretini belirlemek iin aktivasyon

fonksiyonu uygular.

Yapay sinir alar, birbirine bal ok sayda ilemci elemanlardan olumu,

genellikle paralel ileyen yaplar olarak adlandrlabilir. Yapay sinir alarndaki ilem

elemanlar (dmler) basit sinirler olarak adlandrlrlar. Bir yapay sinir a birbirine

balantl, ok sayda dmlerden oluur.

Yapay sinir alar insan beyni gibi renme, hatrlama ve genelleme yeteneine

sahiptirler.

30

nsan beyninde renme 3 ekilde olur;

Yeni aksonlar reterek,

Aksonlarn uyarlmasyla,

Mevcut aksonlarn glerini deitirerek.

Her aksonun zerinden geen iaretleri deerlendirebilecek yetenekte olduu

savunulmaktadr. Aksonun bu zellii, bir iaretin belli bir sinir iin ne kadar nemli

olduunu gstermektedir [48].

2.1.2.5.1. Giriler

Giriler tarafndan bir yapay sinir hcresine bir baka yapay sinir hcresinden

veya d dnyadan bilgi al yaplr. Bunlar an renmesi istenen rnekler tarafndan

belirlenir.

2.1.2.5.2. Arlklar

Arlklar bir yapay sinir hcresinin girileri tarafndan alnan bilgilerin nemini

ve hcre zerinde etkisi gsteren uygun katsaylardr. Her bir giri iin bir arlk vardr.

Bu arln byk olmas bu giriin nemli olduu ya da arln kk olmas giriin

nemsiz olduunu gstermez. Bir arln deerinin sfr olmas o a iin en nemli

olay olabilir. Eksi deerler de yine giriin nemsiz olduunu gstermez. Arln art

ve eksi olmas giriin etkisinin pozitif ya da negatif olduunu gsterir. Arlklar

deiken ya da sabit olabilirler [56].

31

2.1.2.5.3. Toplama levi

Toplama ilevi bir yapay sinirdeki her bir giri ile o girie ait olan arln

arplarak bu arpmlarn toplanmasdr.

n

i iiNet Toplam x w= S

(2.7)

Ancak birok uygulama aadaki gibi eik deeri olan da bu toplamaya

katlmtr.

n

i ii

NetToplam x w q= + ya dan

i ii

NetToplam x w q= - (2.8) eik deerinin girilerden bamsz olduu iin btn girilerin sfr olmas

durumunda k deerinin sfr deil de eik deerine eit olduu grlr ki bu da,

belirtilen artlar altnda nron knn sfr olmas zorunluluunu ortadan kaldrr. Eik

deerinin kullanm, toplama fonksiyonuna +1 ya da -1 deerine sahip sabit bir giriin

arlna sahip bir balant ile eklendii eklinde yorumlanr [48].

Ayrca her model ve her uygulama iin bu toplama fonksiyonun kullanlmas

art deildir. Baz modeller, kullanlacak toplama fonksiyonunu kendileri belirler. ou

zaman daha karmak olan deiik toplama fonksiyonlar kullanlr. Bunlar Tablo 2.3de

gsterilmitir. Baz durumlarda girilerin deeri nemli olurken, bazlarnda says

nemli olabilir. Bir problem iin en uygun toplama fonksiyonunu belirlemek iin bir

forml gelitirilememitir. Bu yzden en uygun toplama fonksiyonunun bulunmas

deneme yanlma yoluyla belirlenir. Ayrca ayn problem iin kullanlan yapay sinir

hcrelerinden hepsi ayn toplama fonksiyonunu kullanabilecei gibi her biri iin farkl

toplama fonksiyonu kullanlabilir [48].

32

Tablo 2.3 Toplama Fonksiyonu rnekleri Toplama levi

Toplama levi Aklama

arpm

i iiNet Girdi x w= P

Giriler ve arlklar arplr sonra bu

deerler de birbiriyle arplr.

Maksimum (En ok)

( ), 1,2,...,i iNet Girdi Max x w i N= =

N adet giri ve arlk birbiriyle

arpldktan sonra en by net girdi

olarak kabul edilir.

Maksimum (En az)

( ), 1, 2,...,i iNet Girdi Min x w i N= =


arpldktan sonra en k net girdi

olarak kabul edilir.

ounluk

sgn( )i iiNet Girdi x w= S


arpldktan sonra pozitif ve negatif

olanlarn says bulunur. Bunlardan

byk olan net girdi olarak alnr.

Kmltif Toplam

( ) ( )i iiNet Girdi Net eski x w= + S

Hcreye gelen bilgiler arlkl olarak

toplanr ve daha nce gelen bilgilere

eklenerek hcrenin net girdisi bulunur.

2.1.2.5.4. Etkinlik levi (Aktivasyon Fonksiyonu)

Yapay nronun davrann belirleyen nemli bir etken aktivasyon

fonksiyonudur. Buna ayn zamanda renme erileri de denir. Aktivasyon fonksiyonu

hcreye gelen net girdiyi, dier bir deyile toplama fonksiyonunu ileyerek bu hcreye

gelen girilere karlk olan k belirler.

Aktivasyon fonksiyonu da yapay sinir alarnn farkl modelleri iin farkl

olabilir. En uygun aktivasyon fonksiyonunu belirlemek iin gelitirilmi bir fonksiyon

yoktur. Toplama fonksiyonuna benzer ekilde hcrelerin hepsi iin ayn aktivasyon

33

fonksiyonu kullanma zorunluluu yoktur. Bazlar ayn aktivasyon fonksiyonunu

kullanrken bazlar kullanmayabilir [48].

Baz modeller iin zellikle de ok Katmanl Alglayc model iin bu fonksiyon

trevi alnabilir ve srekli olmaldr. Yapay sinir alarnn kullanm amacna gre tek

veya ift ynl aktivasyon fonksiyonu kullanlabilir.

Dorusal olmayan fonksiyonlarn kullanlmas yapay sinir alarnn ok

karmak ve farkl problemlere uygulanmasn salamtr. En ok kullanlan aktivasyon

fonksiyonlar unlardr [23,26,29,48,53]:

2.1.2.5.4.1. Dorusal Fonksiyon

Dorusal fonksiyon, hcreye gelen girileri olduu gibi ka verir.

Fonksiyonun ekli ekil 2.9da verilmitir. ounlukla ADALINE olarak bilinen

dorusal modelde, klasik iaret ileme ve regresyon analizinde kullanlr. Denklemi;

n

i ii

v x w= veyan

i ii

v x w q= + olmak zere;

( )y F v Av= = (2.9)

Formldeki A sabit katsaysdr.

ekil 2.9. Dorusal veya Lineer Fonksiyon

34

2.1.2.5.4.2. Basamak Fonksiyonu

Basamak fonksiyonu tek veya ift kutuplu olabilir. Bu fonksiyonlarn ekli ekil

2.10de, matematiksel ifadeleri de aada verilmitir. Perceptron (Basit Alglayc

Model) olarak bilinen yapay sinir hcresi aktivasyon fonksiyonu olarak bu fonksiyonu

kullanr.

1 0( )

0 0v

y F vv = =

35

ekil 2.11. Tek kutuplamal Basamak Fonksiyonu

ift kutuplu basamak fonksiyonu ise;

1 . 0( )

1 . 0w x

y F vw x

+ = = -

36

fonksiyon basamak fonksiyonu gibi davranr. Aadaki denklem fonksiyonu, ekil

2.13de grafii gsterilmitir.

0 1/ 2( ) 1/ 2 1/ 2

1 1/ 2

vy F v v v

v

aa a

a

= = +

37

ekil 2.14. Sigmoid Tipli Fonksiyon

2.1.2.5.4.6. Tanjant Hiperbolik Tipli Fonksiyon

Uygulamalarda ok kullanlan aktivasyon fonksiyonlarndan biri de Tanjant

Hiperbolik fonksiyondur. Bu fonksiyon ift kutuplu fonksiyon olarak da bilinir. Giri

uzaynn geniletilmesinde etkin bir ekilde kullanlan bir fonksiyondur. Fonksiyonun

ekli ekil 2.15de forml ise aadaki gsterildii gibidir.

2

2

1 tanh( )1

v

v

ey ve

b--= =

+ (2.15)

ekil 2.15. Tanjant Hiperbolik Tipli Fonksiyon

38

2.1.2.5.4.7. Sins Tipli Fonksiyon

renilmesi dnlen olaylar sins fonksiyonuna uygun dalm gsteriyorsa

bu gibi durumlarda aktivasyon fonksiyonu olarak sins fonksiyonu kullanlr.

Fonksiyonun ekli ekil 2.16de ve forml aada verilmitir.

( ) ( )y f v Sin v= =(2.16)

ekil 2.16. Sins Tipli Fonksiyon

Bir yapay sinir ann bu 5 temel eleman dnda zaman zaman ihtiya

duyulduunda kullanlan bir eleman daha vardr. Bu eleman lekleme ve snrlama

olarak adlandrlr.

2.1.2.5.5. k levi

ks y = f(v), aktivasyon fonksiyonunun sonucunun d dnyaya veya dier

sinirlere gnderilmesidir. Bu sinirin ks kendine ve kendinden sonra gelen bir ya da

daha fazla sayda sinire giri olabilir.

2.1.2.6. A Girilerinin Hesaplanmas in Matris arpma Metodu

39

Sinir alarnn balantl arlklarn W = (wij) matrisinde kaydedelim. Bu

halde, Yj nin a girdisi x = ( x1,..., xi, ...,xn) vektrnn w.j arlk matrisinin j. kolonu

ile (eer j. elemanda sapma yoksa) basit bir arplmas ilemi ile gerekletirilir :

1

. 1_ . .j i ijiy in x w x w== = S (2.17)

Sapma

Sapma deeri, x vektrne x0 = 1 deeri eklenerek oluturulabilir.

x = (l, x, ..., xi, ..., xn)(2.18)

Sapma ayn dier arlklar gibi davramr, yani w0j = bj dir. Yj birimi iin a

girdisi u ekilde hesaplanr:

. 01 1 1

_ . . . .n n n

j j i ij j i ij j i iji i

y in x w x w w x w b x w+= =

= = = = + (2.19)Bir YSA dmnn grevi, giriindeki saylar kendi arlk deerleri ile

arpp, sonra da bu arpmlar toplayp, toplam bir yumuatma fonksiyonundan

(genelde sigmoid 1( )1 x

f xe-

= + veya tanh) gerdkten sonra ka vermektr. Ancak

giri ve k katmanndaki nronlar bu kuraln dndadr. Giri katmanndaki nronlar

ise sadece kendi girilerindeki verilerin uygun arlklarla arplm durumlarn

toplayp saklarlar. Bu ileme ilerleme denir [58,60].

2.1.2.7. Yapay Sinir Hcresinin alma Prensibi

ekil 2.17da girileri ve arlklar verilmi olan bir yapay sinir hcresinin

almas yledir:

40

ekil 2.17. Yapay Sinir Ann alma rnei

Hcreye gelen net girdi, arlklarla giriler arplarak aadaki gibi hesaplanr.

NET Girdi = 0.7 * 0.2 + 0.4 *(-0.2) + 0.3*0.1

NET Girdi = 0.14 - 0.08 + 0.03

NET Girdi = 0.09

Hcrenin sigmoid tipli aktivasyon fonksiyonuna gre k y=f(v) yledir;

y = f(v) = 1 / (1+e-0.09)

y = 0.52

Sonuta verilen girdilere karlk yukardaki ilemler sonucunda y k deeri

bulunur.

41

ekil 2.18 YSA de Kullanlan Geri Yaylml renme Algoritmas

42

2.1.3. Lojistik Regresyon Analizi

Lojistik regresyon; baml deikeninin kategorik ve ikili, l ve oklu

kategorilerde gzlendii durumlarda bamsz deikenlerle neden sonu ilikisini

belirlemede yararlanlan bir yntemdir. Bamsz deikenlere gre baml

deikeninin beklenen deerlerinin olaslk olarak elde edildii bir regresyon

yntemidir. Basit ve oklu regresyon analizleri baml deiken ile bamsz deiken

ya da deikenler arasndaki matematiksel banty analiz etmekte kullanlmaktadr. Bu

yntemlerin uygulanabilecei veri setlerinde baml deikenin normal dalm

gstermesi, bamsz deikenlerinde normal dalm gsteren toplum ya da

toplumlardan ekilmi olmas ve hata varyansnn ),0(2se N@ parametreli normal

dalm gstermesi gerekmektedir. Bu ve benzeri koullarn yerine getirilmedii veri

setlerinde basit ya da oklu regresyon analizleri uygulanamaz. Lojistik regresyon

analizi, snflama ve atama ilemi yapmaya yardmc olan bir regresyon yntemidir.

Normal dalm varsaym, sreklilik varsaym n koulu yoktur. Baml deiken

zerinde bamsz deikenlerin etkileri olaslk olarak elde edilerek risk faktrlerinin

olaslk olarak belirlenmesi salanr [11,18,19,25].

Aratrclar zerinde altklar konuda ok etken olmas durumunda etkenlerin

tek tek baml deiken zerine etkisi yannda, bunlarn birlikte etkisini de renmek

ya da incelemek istemektedirler. Birlikte etkinin incelenmesinde kullanlan deiik

istatistik yntemler bulunmaktadr. rnein, baml deikenin srekli, bamsz

deikenlerin kesikli olmas durumunda varyans analizi, hepsinin kesikli olmas

durumunda log-linear modeller, hepsinin srekli olmas durumunda regresyon analizi

gibi. Tp alanndaki aratrmalarda ou zaman baml ve bamsz deikenlerin tr

ve yaplar yukarda belirtilenlere benzemez, srekli ve kesikli karm bamsz

43

deikenlerle karlalr. zerinde en ok durulan ve aratrc iin nemli olan dier

bir konu da etken veya etkenlerle hastalk arasndaki ilikinin risk ynnden

incelenmesidir. Bu tip incelemelerde arlkl olarak LRA kullanlmaktadr [20,41].

Lojistik regresyon modelinin kullanmna ilikin ilk almalar Berkson (1944)

tarafndan yaplm ve model Finney (1972) tarafndan biyolojik deneylerde probit

analize bir alternatif olarak nerilmitir . Son yllarda youn bir ekilde kullanlan LRA,

gzlemlerin gruplara atanmasnda sk kullanlan yntemden (dierleri kmeleme

analizi ve ayrma analizi) birisidir. LRA da grup says bilinmekte, mevcut veriler

kullanlarak bir ayrmsama modeli elde edilmekte ve kurulan bu model yardmyla veri

kmesine eklenen yeni gzlemlerin gruplara atanmas mmkn olabilmektedir [42].

Dorusal regresyon analizinde baml deikenin deeri tahmin edilirken, LRA

da baml deikenin alaca deerlerden birinin gerekleme olasl tahmin edilir.

Bu olaslk deerinin tahmininde aadaki model kullanlmaktadr.

( )0 1

0 11

x

x

exe

b b

b bp+

+= + (2.20)

Lojistik regresyon modeliyle tahmin yaplaca genel olarak kullanlan yntem

en ok olabilirlik metodudur. Genel anlamda en ok olabilirlik metodu, gzlenen veri

kmesini elde etmenin olasln maksimum yapan bilinmeyen parametrelerin

deerlerini tahmin etmede kullanlr. Bu metodu uygulayabilmek iin en ok olabilirlik

fonksiyonunun oluturulmas gerekmekte ve ilgili parametrelerin en ok olabilirlik

tahmincileri, fonksiyonu maksimum yapacak deerleri bulacak ekilde seilmelidir [6].

LRA da gzlenen deerlerle tahmin edilen deerler aadaki ifadeyle

karlatrlr.

2ln Su andaki ModelinolabilirligiDDoymus Modelinolabilirligi

= - (2.21)

44

Modelde bulunan herhangi bir bamsz deikenin nemliliine karar vermek

iin denklemde o bamsz deikenin bulunduu ve bulunmad durumlardaki D

deerleri, G istatistii kullanlarak karlatrlrlar. G istatistii p serbestlik derecesiyle

ki-kare dalm gsterecektir.

G = D(Deikensiz model iin) - D(Deikenli model iin)

2ln Degiskensiz ModelinolabilirligiDDegiskenli Modelinolabilirligi

= - (2.22)

Katsaylarn nemlilikleri test edildikten sonra katsaylarn yorumlanmas odds

oranlar kullanlarak yaplmaktadr. LRA nn kullanm amalarndan en nemlisi tp

biliminde sklkla karlalan baml deikenin iki ya da daha ok dzey ierdii,

bamsz deikenlerin ise hem kesikli hem de srekli olabildii durumlarda verilerin

ait olduklar gruplara en doru ekilde atayacak ve hastalklara ilikin risk faktrlerini

belirleyebilecek modeli kurmaktr. Bunun yannda lojistik regresyon, baml

deikenin tahminini olaslk olarak hesaplayarak olaslk kurallarna uygun snflama

ilemi yapma olana vermektedir [20,23,43].

2.1.3.1. Lojistik Snflandrma ve Lojistik Regresyon Modeli

Baml deikenin 0.1 deerlerine karlk gelen G1 ve G2 gruplar x1,x2,...,xp

bamsz deikenlerine dayanlarak snflandrlmak istensin. Gruplardaki birey says

sra ile n1 ve n2 olduunda, N=n1+n2 gzleme dayal snflandrma kuralnn oluumu

fs(x1,x2,...,xp) eklindeki olaslk fonksiyonunun fonksiyonel yapsna ilikin

varsaymlara dayanr. Fonksiyon yaps iin tr varsaym sz konusudur [13,14,44].

i. ok deikenli normal dalm fonksiyonu

ii. Lojistik snflandrma fonksiyonu

45

iii. Dalmdan bamsz kernel snflandrma fonksiyonu

Lojistik snflama fonksiyonu sz konusu olduunda X0=l iken fs(x1,x2,...,xp),

Gs(s=l,2) grubunun olaslk younluk fonksiyonu olarak tanmlanr. Lojistik varsaym,

'=( o, ...., p) iin,

1 1

2 2

( ) ( )exp( ) ln( ) ( )

f x f xX ya da Xf x f x

b b = = (2.23)

eklinde tanmlanmaktadr. Bu son eitlik log-olabilirlik oram olup x ler

dorusaldr. Lojistik varsaym bilinmeyen P parametrelerini iermektedir. Her bir

gzlem iin X koulu altnda gruplardan birine atanma olasl olarak tanmlanan

sonsal olaslklar hesaplamak iin P tahminleri gerekmektedir. Bunun iin lojistik

varsaym altnda rneklemin olabilirlik fonksiyonu belirlenmelidir. Kark

rneklemede gzlemler (X,G) bileik dalmndan rneklenmekte yani gzlemler hangi

gruptan olduu bilinmeksizin rasgele seilmektedir. Buradan G grup yeliini gsteren

deiken olup iki grup olduunda G1 ve G2 eklinde gsterilmektedir [44].

Koullu rneklemede G nin x koulu altnda dalm incelenmektedir.

Biyolojik deneylerin analizinde ok sk kullanlan bu rnekleme trne ilikin

olabilirlik fonksiyonu dier rnekleme trlerinin olabilirlik fonksiyonuna temel tekil

etmektedir. Ayr rnekleme de ise x in G koulu altnda dalmndan rnekleme

yaplmaktadr. Anderson (1972, 1982) tarafndan detayl olarak incelenen bu rnekleme

trnn uygulamas zor olup gemie ynelik (retrospective) almalarda

uygulanmaktadr [41].

Regresyon problemlerinde anahtar deer, verilen bir bamsz deiken deerine

bal olarak baml deikenin ortalama deerini bulmaktr. Bu deer koullu ortalama

olarak adlandrlr ve E(Y \ x) ile gsterilir. Burada ynin baml deikeni, x in ise

46

bamsz deikeni gsterdii varsaylsn. E(Y\ x) ifadesi x deeri verildiinde, y nin

beklenen deeri ni gstermektedir. Dorusal regresyon analizinde, koullu

ortalamann, x in dorusal bir denklemi olduu varsaylr.

0 1( \ )E Y x xb b= + (2.24)

Yukardaki bu ifadeden, xin aralnn - ve + arasnda deimesinden dolay,

E(Y\ x)in mmkn olan her deeri alabilecei grlmektedir. Baml deiken ikili

olduu zaman koullu ortalama, sfrla bir arasnda deimek zorundadr [44].

[0 < E(Y\ x ) 1]. x deki her birim deime sonucunda E(Y\ x)de oluan deiiklik,

koullu ortalama 0a ya da 1e yaklatka ilerleyerek az olur.

ki dzey ieren bir baml deikenin analizinde kullanlmak zere nerilen

birok dalm fonksiyonu bulunmutur [6]. Lojistik dalm kullanldnda gsterimi

kolaylatrmak iin, x bilindiinde Y nin koullu ortalamasn gstermek iin (x) =

E(Y\ x) ifadesi kullanlmaktadr. Kullanlacak lojistik regresyon modelinin ak ekli

aadaki gibidir [6,16,17,44].

( )0 1

0 11

x

x

exe

b b

b bp+

+= + (2.25)

Lojistik regresyon almasna merkez olacak (x)in bir transformasyonu

yukarda bahsedildii gibi lojit transformasyondur. Bu transformasyon (x)cinsinden

tanmlanrsa:

( )( ) ln1 ( )

xg xx

pp

= - 0 1xb b+= (2.26)

Lojit g(x) parametreleri bakmndan dorusal ve xin ald deerlere bal

olarak - ve + arasnda deimektedir [25].

47

2.2. PROSTAT KANSER

2.2.1. Prostat Kanseri Hakknda Genel Bilgi

Prostat kanseri erkeklerde en yaygn grlen kanser trdr ve ngiltere ve

Gallerde yeni tan konulan kanser olgularnn %25ini tekil eder. Prostat bezesinin

kt huylu tmr demek olan prostat kanseri, Robert Koch Enstitsnn en yeni

tahminlerine gre Almanyada erkeklerde en sk rastlanan kanser hastaldr. 2000

ylnda bu hastala ilk defa yakalananlarn says yaklak 40.000 kiiydi, yaklak

11.000 kii de bu hastalk yznden hayatn kaybetti.

Prostat kanserinin nasl ve neden ortaya kt sorusu bugne kadar tam olarak

cevaplandrabilmi deildir. lke olarak ya ilerledike prostat kanseri riski de

artmaktadr. 50 yan altndaki erkekler seyrek olarak hastalanr, en yksek hastalanma

oranlar 70 yan stndeki erkeklerde grlmektedir.

Kiinin kendi babas, erkek kardeleri veya byk babalar prostat kanserine

yakalanm ise daha yksek bir risk var demektir. Bu nedenle kaltm yoluyla geme

veya en azndan genlerden kaynaklanan bir hastalanma eiliminin mevcut olduu

tahmin edilmektedir.

te yandan prostat kanserine yakalanm olan erkeklerin % 80inde herhangi bir

akrabada prostat kanseri grlmemitir. Beslenme biiminin de bir rol oynad

ynnde iaretler vardr.

2.2.2. Prostat Nedir?

Prostat erkein en nemli cinsel salg bezesidir. Prostat bezesi, mesanenin (idrar

torbasnn) idrar yoluna baland yerde, idrar borusunu epeevre saran bir organdr.

Birok erkekte yan ilerlemesiyle prostatn idrar yolunun hemen yanndaki i

48

blmnde iyi huylu bir tmr oluur. Prostat 60 yandaki bir erkekte ortalama 30 ila

40 ml byklktedir. Bu, yaklak iki ceviz bykl demektir. Bu iyi huylu ve prostat

hiper plazisi (ar byme) ad verilen byme idrar yolunu daraltarak idrar yapmada

zorluklara sebep olabilir.

Buna karlk prostat kanseri ounlukla prostatn makattan (gden barsa

veya rektum) parmakla eriilebilen d blmnde oluur. Prostat karsinomlarnn

yaklak % 80i prostat bezesinin bu d blmnde ortaya kar. Prostat kanserinin

prostat bezesinin i blmnde veya pubis kemiinin arkasnda yer alan n ksmnda

olumas enderdir.

2.2.3. Tehis

pheli bir durum ortaya ktktan sonra prostat kanseri tehisi koyulabilmesi

iin bir dizi muayene daha yaplmas gerekir. Bunlar:

2.2.3.1. Prostatn Parmakla Muayenesi

Prostat bezesi makattan (gden barsa veya rektum) parmakla yoklanarak

muayene edilebilir. Normal olarak prostat (el gergin tutulduunda insann elinin ayas

gibi) yumuak ve esnektir. Prostat kanseri ise ounlukla kemik gibi serttir. Bu sayede

tecrbeli bir doktor prostat kanserini parmakla yoklayarak bulabilir ve dmn

bykln tahmin edebilir. Eer parmakla yoklandnda bir dm hissediliyorsa

tmr ounlukla prostat kapslne de yerlemi veya prostat kapsln delip gemi

demektir.

2.2.3.2. Prostata zg Antijenin Belirlenmesi (PSA)

Prostat meni svsnn byk blmn reten organdr. Bu meni svs iinde

meni svsn akkan hale getirmeye yarayan bir protein vardr. Sz konusu proteine

prostata zg antijen denir, bunun ksaltmas da PSAdr. PSA normal artlar altnda da

49

kana karabilir ve kandaki miktar PSA testi ile llebilir. Ya ilerledike prostat

bydnden kandaki PSA miktar da ykselir. Her gram iyi huylu prostat dokusu

bana aa yukar 0,3 ng/ml antijen bulunur. Buna karlk prostat kanseri her gram

doku bana yaklak 10 kere daha fazla PSA retir. Bu yzden PSA prostat kanserinin

tehis edilebilmesi iin, yani tmr belirteci (tmr markeri) olarak kullanlmaya,

uygundur.

Tablo 2.4 Yaa zg Normal Serum PSA Deerleri

YA PSA

40-49 0-2,5 ng/ml

50-59 0-3,5 ng/ml

60-69 0-4,5 ng/ml

70-79 0-6,5 ng/ml

2.2.3.3. Makattan (rektum) Ultrason Muayenesi (TRUS)

Ultrason muayenesi ile vcudun i organlarn, ua yk yklemeden

grntlemek mmkn olmaktadr. Prostatn deerlendirilmesi iin makata (rektum

veya gden barsa da denir) ufak bir ubuk biiminde bir sonda sokulur. Bylece

prostatn yalnzca bykl ve biimi deil, prostatn doku yaps ve eer mevcutsa,

kt huylu doku deiikliklerinin olup olmad da grlebilir. Ancak prostat kanseri

iin tipik olan doku deiiklikleri ou kereler ancak byke tmr dmlerinde

grlebilmektedir. Bunun tesinde, ultrason ile grntleme yntemi prostattan hedefli

olarak doku alabilmek iin de gayet yararldr [62, 63, 64].

50

3. GERE ve YNTEM

Uygulama verisi olarak, Tokat Gaziosmanpaa niversitesi Tp Fakltesi

Hastanesinde 01.01.2005 tarihi ve 31.05.2011 tarihleri arasnda roloji Polikliniine

bavuran hastalarn sonular alnmtr. Veritaban ynetim sistemi Oracle 10 GR2 olan

hastane veritabanndan Structured Query Language (SQL) veritaban sorgu dili

kullanlarak gerekli bilgiler ekilmitir. Belirtilen tarihler arasnda roloji Polikliniine

bavurup muayenesi ve tetkikleri yaplp kesin tan olarak C61, Prostat malign

neoplazm (prostat kanseri) tans konulan hastalarn muayene bilgileri incelenmitir.

ncelenen muayene bilgileri ierisinde prostat kanserini tehis iin kullanlan drt faktr

incelenmitir. Bu faktrler;

i. Ya,

ii. Prostatn parmakla muayenesi (rektal tue),

iii. Genetik yatknlk bilgisi ve

iv. PSA dzeyidir.

ncelenen hastalardan kesin tans prostat kanseri olup muayene notlar ierisinde

yukarda sralanan faktrlerin hepsinin bulunduu hastalar seilmitir. Bu ekilde

yaplan tarama sonucunda 118 hasta verisi tespit edilmitir. Ayn ekilde muayene

notlar ierisinde ya, rektal tue, genetik yatknlk ve PSA tetkik sonucu bulunan ama

kesin tans C61, Prostat malign neoplazm (prostat kanseri) olmayan 118 hasta daha

seilerek toplam 236 hastalk veri setine ulalmtr.

Veri setinin WEKA programna yklenebilmesi iin arff formatnda olmas

gerekmektedir. WEKA program Arff Viewer seenei ile .cvs uzantl dosyalar

aabilmektedir. Bu nedenle, ncelikle MS Excel ortamda edinilen veriler .xls

51

formatndan .cvs (comma-separeted variables) (virglle ayrlm veriler) formatna

dntrlmtr. Bu format trndeki veriler Ek-1de sunulmutur

Veri madencilii algoritmalarndan Lojistik Regresyon Analizi (LRA), Yapay

Sinir Alar (YSA) Ve Snflandrma Ve Regresyon Aalar (C&RT) yntemlerinin

karlatrlmas iin prostat kanseri verileri kullanlmtr.

3.1. C&RT ALGORTMASI

Bilimsel almalardan elde edilen verilerin analizinde snflama ve regresyon

aalar, kmeleme, ayrma ve lojistik regresyon analizlerini ieren snflama

yntemleri ve regresyon modelleri sklkla kullanlmaktadr [36]. Ancak bu tr

modellerin gerektirdii varsaymlar pek ok alanda istatistiksel analiz olanaklarn

kstlamaktadr. ncelenen veri seti zerinde hibir varsaym gerektirmemesi nedeniyle,

snflama ve regresyon aalar (C&RT) bu tr parametrik yntemlere kar gl bir

alternatif olarak ortaya kmaktadr [32].

Breiman ve arkadalar tarafndan 1984 ylnda gelitirilen ok saydaki

aklayc (x) deikeni ile yant (y) deikenine karar vermede kullanlan istatistiksel

bir tekniktir. C&RT hem kategorik hem de srekli deikenleri kullanarak snflama ve

regresyon problemlerinin zmnde karar aalarn kullanan parametrik olmayan

istatistiksel bir metottur. Ele alnan baml deiken kategorik ise yntem snflama

aalar (Classification Tree), srekli ise regresyon aalar (Regression Tree) olarak

adlandrlmaktadr [37]. Bu ynyle C&RT, hem oklu regresyon analizini hem de

baml deikenin kategorik olduu durumlarda kullanlan lojistik regresyon analizini

kapsamaktadr.

52

Yaplan almalarda kullanlan C&RT algoritmas, her aamada ilgili kmeyi

kendinden daha homojen olan iki alt kmeye ayrarak ikili karar aalar oluturan bir

yapya sahiptir. Dier bir ifadeyle C&RT, iki yavru dm oluturup btn bamsz

deikenleri kullanarak veriyi alt gruplara ayrmak zerine kurulmutur. En iyi bamsz

deiken safszlk (impurity) ve deiim llerindeki (gini, twoing, en kk kareler

sapmas) deikenlii kullanarak seilir. Burada ama hedef deikene ilikin mmkn

olabilen en homojen veri alt gruplarn retmektir [5].

C&RT, sadece baml deiken ile bamsz deiken arasndaki ilikinin

yapsn aratrmakla kalmayp, ayn zamanda bamsz deikenlerin birbirleri ile olan

etkileimlerini de ortaya koymaya almaktadr. C&RT algoritmasnn, bamsz

deikenlerin baml deikenle ilikisini deerlendirmede ve model iindeki etkileim

yapsn zmlemede nemli avantajlar mevcuttur [37,38].

C&RTn sahip olduu algoritma, benzerlik gsteren deikenlerin ayn aa

dmnde toplanmasna dayal olup, btn oluturduu alt dallar baml deiken

olan kk dme balamayla son bulmaktadr [38]. C&RT analizi genellikle 3 admdan

olumaktadr. Birinci adm veri setini tanmlayan maksimum aacn oluturulmasdr.

kinci adm; oluturulan aalar ierisinden baml deikenle nemli ilikisi olan

aalar semek iin yaplan budama ilemi ve son adm ise en uygun aa yapsnn

seimidir [37].

3.1.1. Maksimum Aacn Oluturulmas

Maksimum aa, aacn kknde balayan bir ikili blme ilemi kullanan

yapdr. Aacn kk, veri seti ierisindeki her nesneyi iermekte ve her bir seviyede

kendine zg iki alt dm halinde blnen bir ana dm olarak dnlmektedir.

53

Sonraki admda, her alt grup bir ana grup olmaktadr. Her blnme bir alt gruptaki tm

nesnelerin benzer baml deiken deerlerine sahip olacak ekilde seilen bir

aklaycnn deeri ile tanmlanmaktadr [37,38].

Srekli deikenlerin blnmesi xinin seilmi bamsz deiken ve a jnin

onun blnme deeri olan x i < aj ile ifade edilmektedir.

Bir blnme ve onun blnme deeri iin en uygun tanmlaycy semek iin

C&RT, iinde tm tanmlayclarn ve tm blnme deerlerinin dnld bir

algoritma kullanmakta ve test koulunun ne kadar iyi uygulandn belirlemek iin ana

dmn safszlk derecesini alt dmlerin safszlk derecesiyle karlatrmaktadr.

Ana ve alt dmlerin safszlklar arasndaki fark ne kadar bykse test koulu o kadar

daha iyi olduundan, ana dm (tp) ve alt dmler (tL ve tR) arasndaki safszlk

lsn en iyi azaltan blnme seilmektedir. Matematiksel olarak bu durum aadaki

gibi ifade edilmektedir [37]:

i(s, tp ) = ip (tp ) - PLi(tL) - PRi(tR) (3.1)

Burada i safszl, s aday blnme deerini ve PL ile PR srasyla sa ve soldaki

alt dmlerdeki nesnelerin blnmelerini ifade etmektedir. Bu eitlikte i(s, t )

deerini maksimize edecek s deerinin seilmesi amalanmakta ve tp dmnde

btn kaytlarn katlmyla hesaplanan bu deer, C&RT aacnda gelime

(improvement) kavram ile ifade edilmektedir. C&RT algoritmas aac gelitirirken

i(s, tp ) yi maksimize eden bir test koulu setiinden ve ip(tp ) btn test koullar

iin ayn olduundan, i(s, tp ) yi maksimize etmek alt dmlerin safszlk llerinin

arlkl ortalamalarn minimize etmekle edeer olmaktadr [37].

54

Her bir dmn her aamada ikiye ayrld C&RT algoritmasnda, her bir

blnme noktasnn belirlenmesinde Gini, Twoing gibi en iyi blmeyi semek iin

gelitirilen sz konusu safszlk ltlerinden Gini indeksi kullanlmaktadr. Gini

indeksi aadaki gibi hesaplanmaktadr [40].

1) Her nitelik deerleri ikili olacak biimde gruplanmakta ve bu ekilde elde edilen

sol ve sa blnmelere karlk gelen snf deerleri gruplandrlmaktadr.

2) Her bir nitelikle ilgili olarak sol ve sa taraftaki blnmeler iin Ginisol ve

Ginisa deerleri;

k: Snflarn says,

T: Bir dmdeki rnekler,

Tsol: Sol dmdeki rneklerin says,

Tsa: Sa dmdeki rneklerin says,

Li: Sol dmde i kategorisindeki rneklerin says.

Ri: Sa dmde i kategorisindeki rneklerin says olmak zere;

Ginisol = 1-2

1

ki

i sol

LT=

,

Ginisa = 1-2

1

ki

i sol

LT=

,

eklinde hesaplanmakta ve her j nitelii iin, eitim verisindeki satr says n olmak

zere genel Gini indeks deeri ise;

Ginij = ( )1 sol sol sag sagT Gini T Ginin + forml ile hesaplanmaktadr.

55

3.2. YAPAY SNR AI MODELLER

Sinir alar, tek katmanl ya da ok katmanl olarak snflandrlrlar. Katman

saysn belirlerken, girdi birimi bir katman olarak saylmaz; nk bunlar zerinde

hibir hesaplama ilemi yaplmaz.

3.2.1. Tek Katmanl Alglayclar

Tek katmanl yapay sinir alar giri ve k katmanlarndan oluur. Girdi ve

kt katmanlarnda birden fazla giri ve k deeri bulunmaktadr. Giri katmanndaki

her giri deerini k katmanna balayan sinaptik balantlar mevcuttur. Her balant

bir arlk deerine sahiptir. Ayn zamanda an ktsnn sfr olmasn engelleyen bias

sapma deeri mevcuttur.

Tek katmanl YSA rnek snflandrma, tanma, rnek ilikilendirme ve bunun

gibi dier problemlerin zlmesinde kullanlabilir. rnek snflandrma

problemlerinde, her giri vektr (rnek, numune) belirli snflara ait olabilir ya da

olmayabilir. Basit olarak, bir snfa ye olma sorusu gz nnde bulundurulur. k

birimi iin +1 cevabnn alnmasyla rnein o snfa ye olduu, -1 cevab alnrsa,

rnein o snfa ye olmad belirlenir. Bu tip durumlarda, her bir snf iin bir k

birimi vardr. rnek tanmlama, rnek tanma uygulamasmn bir eididir. rneklerin

ilikili hatrlanmas ise daha farkldr [6].

Aada ekil 3.5 de tek arlk katmanl YSA iin rnek verilmitir. Bu a ileri

beslemeli alara birer rnektir.

56

ekil 3.1. Tek Arlk Katmanl Bir Yapay Sinir A

Tek katmanl sinir alarnn eitilmesinde nemli yntem vardr:

Hebb Kural

Perseptron renme Kural

Delta Kural

3.2.1.1. Hebb Kural

Hebb kural, bir yapay sinir a iin, en eski ve en basit renme kural olarak

bilinir. Hebb, renmenin, sinaps uzunluklarn (arlklar) deitirerek meydana

geleceini nermitir. Hebbe gre, eer birbiri ile bal iki nronun her ikisi de ayn

zamanda aktif ise, bu nronlara uygun arlklarn artrlmas gerekmektedir. Benzer

olarak, eer her iki nron ayn zamanda pasif ise, arlklarn artrlmas gerekir. Bu

57

durumda, daha gl bir renme ekli meydana gelir. Gelitirilmi Hebb kural ile tek

katmanl ileri beslemeli bir sinir ann eitilmesi bir Hebb an anlatr. Hebb kural,

dier zgl alar eitmek iin de kullanlabilir. Tek katmanl bir yapay sinir anda

birbiri ile balantl nronlardan bir tanesi giri birimi, bir tanesi de k birimi

olacaktr (hibir giri birimi birbiri ile balanmad iin, herhangi bir k birimleri de

birbiri ile bal deildir [48,59].

3.2.1.2. Perseptron

Perseptronlar, YSAnn renebilir niteliini tayan ilk modelidir. Hebb

kuralndan daha yetenekli bir renme kuraldr. Perseptron tekrarl renme

algoritmasdr ve zmn varl durumunda yaknsama niteliine sahiptir. Bu,

perseptron modelinin en nemli zelliklerinden biridir.

Rosenblatt (1962) ve Minsky-Papert (1969, 1988) tarafndan eitli perseptron

modelleri tanmlanmtr. Orijinal perseptronlar, duyumsal birimler, birletirici birimler

ve cevap birimleri olmak zere nronlarn durumuna sahiptirler. rnein, bir basit

perseptron duyumsal ve birletirici birimler iin ikili aktivasyon, cevap birimi iin ise

+1, 0, veya -1 deerlerini reten aktivasyon uygulayabilir.

Snflandrma problemlerinde eik deerli aktivasyon fonksiyonu kullanlr:

1, _( _ ) 0, _

1, _

y in isef y in y in ise

y in ise

qq q

q

- < -= - > (3.2)

kt biriminin aktivasyonu y = f(y_in) eklinde hesaplamr.

Birletirici birimden cevap birimine giden balantlarn arlklar perseptron

renme kural ile ayarlamr. Her eitim girii iin, sinir a, k biriminin cevabn

58

hesaplar. Daha sonra sinir a, bu rnek iin k deeri ile hedeflenen k arasndaki

fark karlatrarak bir hata oluup olumadn tespit eder. Yapay sinir a,

hesaplanm k deeri 0 ve hedef deeri -1 olan rnek iin hatay ayrt edemez,

buna kart olarak hesaplanm k deeri +1 ve hedef deeri -1 olan rnek iin

hatay ayrt edebilir. Bu durumlarda, hedef verinin iareti ynnde arlklarn iareti

deitirilmelidir. Bununla birlikte k birimine 0 olmayan sinyaller gnderen

balantlANN arlklar ayarlanmaldr. Eer belirli bir eitim giri rneinde hata

oluuyorsa, arlklar

( ) ( )i i iw yeni w eski txa= + (3.3)

formlne gre deitirilmelidir.

Burada hedef deeri t ya +l ya da -ldir ve a renme oran katsaysdr. Eer

hata olumadYSA arlklar deitirilmemelidir. Eitim ilemi hata olumayncaya

kadar devam etmelidir. Perseptron renme kural yaknsama teoremine gre, eer ada

tm eitim rnekleri iin uygun arlklarn varlna izin verilirse, bu arlklar, eitim

srecinde btn eitim rnekleri iin elde edilebilir. Bu kuraln amac, an tarn olarak

doru cevap veremedii eitim rnekleri iin arlklar ayarlamaktr. Ayrca, eitim

sonunda bu a snrsz saydaki eitim admlar iin arlklarn deerlerini bulmaldr

[4,7,50].

3.2.1.2.1. Perseptron Algoritmas

ekil 3.6de perseptronun mimarisi gsterilmitir. Burada X1 ,..., Xn girdi

birimleri, Y kt birimi ve 1 sapma sinyalidir. b sapma arl, wi (i = 1,...,n)

arlklardr.

59

ekil 3.2. Basit Bir Perseptron Mimarisi

Snflandrma problemlerinde, sinir ann grevi tm giri rneklerinin belirli

bir snfa ait olup olmamasn belirlemektir. Snfa ait olma kn +1 deerine, ait

olmama ise kn -1 deerine uygun olmasyla belirlenir. Snflandrma ilemi

yaplabilmesi iin a, tekrarl bir teknik ile eitilir. Girdi ve hedefler ikili ve ya iki

kutuplu olabilir. eik deeri tm birimler iin deimezdir. Sapma ve eik deerinin

her ikisinin ayn zamanda kullanlmasna ihtiya duyulmaktadr. Bu ilemin algoritmas

aada verilmitir. Bu algoritma, arlklarn balang deerlerine ve renme oranna

tam olarak duyarl deildir [6].

Adm 0 Arlklar ve sapmalara balang deerleri ata.

(Arlklar ve sapma deeri kolaylk iin 0 olarak ahnabilir.)

renme oran olan (0 < < l)y ayarla. (kolaylk iin, a, le eitlenebilir.)

Adm 1 Durma koulu yanl iken , adm 2-6' y uygula.

Adm 2 Her bir s:t renme ifti iin, 3-5 admlarn uygula.

Adm 3 Giri birimlerinin aktivasyonlANN ayarla. xi = si i = 1, . . . , n

60

Adm 4 Her kt birimi iin aktivasyonlar hesapla.

_ . 1,...., :j j i iji

y in b x w j m= + =

1, _( _ ) 0, _

1, _

y in isef y in y in ise

y in ise

qq q

q

- < -= - > (3.4)

Adm 5 Arlklar ve sapmalan ayarla.

,j jeger t y ise (3.5)(3.4)

( ) ( )j j jb yeni b eski t= +

( ) ( ) .ij ij j iw yeni w eski t x= +

,j jeger t y ise

( ) ( )j jb yeni b eski=

( ) ( ).ij ijw yeni w eski=

(3.6)Adm 6 Durma koulu:

Eer adm 2de hi bir arlk deimezse dur; aksi duaimda devam et.

Algoritmada kt birimlerinin says m = 1 olabilir. rnein, mantksal fonksiyonlar

gzden geirirken kt biriminin saysnn bir olduu kabul edilir. Eitimden sonra, a

her bir eitim vektrn doru ekilde snflandrr.

Snflandrma ile ilgili perseptron eitim algoritmasnda, ayrma dorusu yerine,

pozitif cevaplar blgesini sfr cevaplar blgesinden ayran w1x1 +w2x2 +b > dorusu

ve negatif cevaplar blgesini sfr cevaplar blgesinden ayran w1x1 +w2x2 +b

61

3.2.1.2.2. Delta

Delta kural, Widrow ve Hoff (1960) tarafndan ADALINE iin ortaya atlm

olan iteratif bir renme srecidir. Delta kuralnda, tm girdi numuneleri iin kt ve

hedef farklar karelerinin toplamnn, baka bir ifadeyle, toplam hatann kltlmesine

hedeflenmitir. Uygun algoritmalarda her numune iin gradient vektrnn ters

ynnde arlklarn gncellenmesi yaplr. Bu durumda delta kural, nron

balantlarnn arlklarn, a girii (y_in) ve an hedef k (t) arasndaki fark en

aza indirgeyecek ekilde deitirir. Ama, tm eitim numunelerinin hatalarn en aza

indirgemektir. Arlk dzeltmeleri, ok saydaki eitim numunesi ile beraber

biriktirilebilir ve bu yn gncelletirilmesi olarak adlandrlr [6].

3.2.2. ok Katmanl Alglayclar

Tek katmanl alar ayrlamayan problemlerin zmnde baarsz

olmaktadrlar. Bunun iinde bilim adamlar ok katmanl YSA modellerini

incelemilerdir. Burada nemli aamalardan biri bu tip alar iin akll bir eitim

algoritmasn gelitirmekti.

LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI (YSA) ve SINIFLANDIRMA ve REGRESYON...

Documents

Transcript of LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI (YSA) ve SINIFLANDIRMA ve REGRESYON...