LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI (YSA) ve SINIFLANDIRMA ve REGRESYON...

128
T.C. GAZİOSMANPAŞA ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI (YSA) ve SINIFLANDIRMA ve REGRESYON AĞAÇLARI (C&RT) YÖNTEMLERİNİN KARŞILAŞTIRILMASI ve TIP ALANINDA BİR UYGULAMA Hazırlayan Yunus Emre Kuyucu Biyoistatistik Anabilim Dalı Yüksek Lisans Tezi Danışman Yrd. Doç. Dr. Ünal Erkorkmaz Tokat-2012

description

LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI(YSA) ve SINIFLANDIRMA ve REGRESYON AĞAÇLARI (C&RT)YÖNTEMLERİNİN KARŞILAŞTIRILMASI ve TIP ALANINDA BİRUYGULAMA

Transcript of LOJİSTİK REGRESYON ANALİZİ (LRA), YAPAY SİNİR AĞLARI (YSA) ve SINIFLANDIRMA ve REGRESYON...

  • T.C.

    GAZOSMANPAA NVERSTES

    SALIK BLMLER ENSTTS

    LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI

    (YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)

    YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR

    UYGULAMA

    Hazrlayan

    Yunus Emre Kuyucu

    Biyoistatistik Anabilim Dal

    Yksek Lisans Tezi

    Danman

    Yrd. Do. Dr. nal Erkorkmaz

    Tokat-2012

  • T.C.

    GAZOSMANPAA NVERSTES

    SALIK BLMLER ENSTTS

    LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI

    (YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)

    YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR

    UYGULAMA

    Hazrlayan

    Yunus Emre Kuyucu

    Biyoistatistik Anabilim Dal

    Yksek Lisans Tezi

    Danman

    Yrd. Do. Dr. nal Erkorkmaz

    Tokat-2012

  • LOJSTK REGRESYON ANALZ (LRA), YAPAY SNR ALARI

    (YSA) ve SINIFLANDIRMA ve REGRESYON AALARI (C&RT)

    YNTEMLERNN KARILATIRILMASI ve TIP ALANINDA BR

    UYGULAMA

    Tezin Kabul Edili Tarihi: 04/01/2012

    Jri yeleri (Unvan, Ad Soyad) mzas

    Prof. Dr. Hafize SEZER(Bakan)

    Yrd. Do. Dr. nal ERKORKMAZ(ye, Danman retim yesi)

    Yrd. Do. Dr. lker ETKAN(ye)

    Bu tez, Gaziosmanpaa niversitesi Salk Bilimleri Enstits Ynetim Kurulunun

    //. tarih ve . sayl oturumunda belirtilen jri tarafndan

    kabul edilmitir.

    Do. Dr. Hseyin ZYURT Mhr

    Enstit Mdr mza

  • T.C.

    GAZOSMANPAA NVERSTES

    SOSYAL BLMLER ENSTTS MDRLNE

    Bu belge ile bu tezdeki btn bilgilerin akademik kurallara ve etik ilkelere

    uygun olarak toplanp sunulduunu, bu kural ve ilkelerin gerei olarak, almada bana

    ait olmayan tm veri, dnce ve sonulara atf yaptm ve kaynan gsterdiimi

    beyan ederim.

    04/01/2012

    Tezi Hazrlayan rencinin

    Ad ve Soyad

    Yunus Emre KUYUCU

    mzas

  • TEEKKRBu tezin hazrlanmas aamasnda yardmlarn esirgemeyen, bana almamn

    her aamasnda deneyim ve bilgileri ile yol gsteren danman hocam Yrd. Do. Dr.

    nal ERKORKMAZ a, hocam Yrd. Do. Dr. lker ETKAN a, sevgisi ve destei ile

    hep yanmda ve kalbimde olan eim Nagehan KUYUCU ya, biricik yavrumuz Elif Naz

    KUYUCU ya ve desteklerinden dolay tm aileme teekkr ediyorum.

  • iZET

    Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar (YSA) ve

    Snflandrma ve Regresyon Aalar (C&RT) Yntemlerinin

    Karlatrlmas ve Tp Alannda Bir Uygulama

    Lojistik Regresyon, baml deikenin kategorik ve bamsz deikenlerin

    kark lekli olmas durumunda belirli bir dalm varsaymna baml kalmakszn

    baml deiken ile bamsz deikenler arasndaki neden-sonu ilikisinin

    belirlenmesinde kullanlan bir yntemdir.

    Yapay Sinir Alar, insan beynindeki sinir alar gibi alarak son derece

    karmak yapya sahip problemlerin zmn salar. Kulland geriye yaylma

    algoritmasn ile a hatasn minimize ederek birimlerin en az hata ile snflarna

    atanmas iin an arlklarn hesaplar.

    Snflandrma ve Regresyon Aalar (C&RT); ikili karar aac oluturan bir

    yntemdir. Aataki her bir noda, her bir bamsz deiken iin geliim skoruna dayal

    olarak en iyi kesim noktas ya da en iyi kategori gruplar oluturulur.

    Bu tez almasnda, Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar

    (YSA) ve Snflandrma ve Regresyon Aalar (C&RT) Yntemlerinin snflandrma

    zelliklerinin karlatrlmas yaplmtr. Bu karlatrma iin prostat kanseri

    ynnden deerlendirilmesi yaplan hastalara ait veriler kullanlm, ynteme gre

    elde edilen sonular baar ynnden deerlendirilmitir.

    Anahtar kelimeler: Lojistik Regresyon Analizi (LRA), Yapay Sinir Alar (YSA),

    Snflandrma Ve Regresyon Aalar (C&RT), Prostat Kanseri.

  • ii

    ABSTRACT

    Comparison of Logistic Regression Analysis (LRA), Artificial Neural

    Networks (ANN) and Classfication and Regression Trees (C&RT)

    Methods And An Aplication In Medicine

    Logistic regression, categorical dependent variable and independent variables in

    the case of mixed-scale without being dependent on the assumption that a certain

    distribution of cause-effect relationship between the dependent variable and

    independent variables used in the determination of a method.

    Artificial Neural Networks, such as neural networks working in the human brain

    is extremely complex structure provides the solution of problems. Error back

    propagation algorithm uses the network by minimizing the weight of the units of the

    network accounts for the appointment of classes with fewer errors.

    Classification and Regression Trees (C & RT) is a method of forming a binary

    decision tree. Each node in the tree, each independent variable on the basis of the best

    cut-off point score for the development or the best category groups are created.

    In this thesis, Logistic Regression Analysis (LRA), Artificial Neural Networks

    (ANN) and Classification and Regression Trees (C & RT) characteristics of the

    classification methods were compared. This comparison of the data used in patients

    undergoing evaluation for prostate cancer in terms of the three methods to the results

    obtained were evaluated in terms of success.

    Key words: Logistic Regression Analysis (LRA), Artificial Neural Networks (ANN),

    Classfication and Regression Trees (C&RT), Prostate Cancer.

  • iii

    NDEKLER

    ZET

    ABSTRACT

    NDEKLER

    TABLOLAR LSTES V

    EKLLER LSTES V

    KISATMALAR VE SMGELER X

    1. GR VE AMA 1

    2. GENEL BLGLER 7

    2.1. SINIFLAMA VE REGRESYON MODELLER 82.1.1. Karar Aalar 92.1.2. Yapay Sinir Alar 18

    2.1.2.1. Yapay Sinir A Nedir? 192.1.2.2. Biyolojik Sinir Alar 242.1.2.3. Yapay Sinir Alarnda Genel Yap 262.1.2.4. Yapay Sinir Hcresi 272.1.2.5. Yapay Sinir Ann Temel Elemanlar 29

    2.1.2.5.1. Giriler 302.1.2.5.2. Arlklar 302.1.2.5.3. Toplama levi 312.1.2.5.4. Etkinlik levi (Aktivasyon Fonksiyonu) 322.1.2.5.5. k levi 38

    2.1.2.6. A Girilerinin Hesaplanmas in Matris arpma Metodu 382.1.2.7. Yapay Sinir Hcresinin alma Prensibi 39ekil 2.17da girileri ve arlklar verilmi olan bir yapay sinir hcresininalmas yledir: 39

    2.1.3. Lojistik Regresyon Analizi 422.1.3.1. Lojistik Snflandrma ve Lojistik Regresyon Modeli 44

    2.2. PROSTAT KANSER 472.2.1. Prostat Kanseri Hakknda Genel Bilgi 472.2.2. Prostat Nedir? 47

  • iv

    2.2.3. Tehis 482.2.3.1. Prostatn Parmakla Muayenesi 482.2.3.2. Prostata zg Antijenin Belirlenmesi (PSA) 482.2.3.3. Makattan (rektum) Ultrason Muayenesi (TRUS) 49

    3. GERE VE YNTEM 50

    3.1. C&RT ALGORTMASI (Classification And Regression Trees: Snflama VeRegresyon Aalar) 51

    3.1.1. Maksimum Aacn Oluturulmas 52

    3.2. YAPAY SNR AI MODELLER 553.2.1. Tek Katmanl Alglayclar 55

    3.2.1.1. Hebb Kural 563.2.1.2. Perseptron 57

    3.2.1.2.1. Perseptron Algoritmas 583.2.1.2.2. Delta 61

    3.2.2. ok Katmanl Alglayclar 613.2.2.1. Geriye Yaylm Algoritmas 633.2.2.2. Standart Geriye Yaylm Eitim Algoritmas 64

    3.2.2.2.1. Geriye Yaylm Algoritma eitleri 653.2.2.2.2. Geri Yaym Mant 66

    3.3. LOJSTK REGRESYON MODEL 693.3.1. Lojistik Regresyon Modelinin Oluturulmas 693.3.2. oklu Lojistik Regresyon Modeli 713.3.3. oklu Lojistik Regresyon Modelinin Kurulmas 723.3.4. Lojistik Regresyon Modelinde Katsaylarn Yorumlanmas 723.3.5. Modelde kiden Fazla Bamsz Deikenin Olduu Durum 73

    3.4. YNTEMLERN KARILATIRILMASI N LTLER 73

    3.5. WEKA 75

    4. BULGULAR 78

    4.1. TANIMLAYICI STATSTKLER 78

    4.2. LOJSTK REGRESYON ANALZ 81

    4.3. SINIFLANDIRMA VE REGRESYON AALARI 86

    4.4. YAPAY SNR ALARI 93

  • v4.5. YNTEMLERN KARILATIRILMASI 99

    5. TARTIMA VE SONU 100

    KAYNAKLAR 104

    EKLER 111

    Ek 1. 111

  • vi

    TABLOLAR LSTES

    Sayfa

    Tablo 2.1. Biyolojik Sinir Hcresi 25

    Tablo 2.2. statistiksel Yntemler le Yapay Sinir AlarnnBenzeimi

    26

    Tablo 2.3. Toplama Fonksiyonu rnekleri Toplama levi 32

    Tablo 2.4. Yaa zg Normal Serum PSA Deerleri 49

    Tablo 4.1. Srekli Deikenler (Ya ve PSA) in Tanmlaycstatistikler (n=236)

    78

    Tablo 4.2. Kategorik Deikenler (Rektal Tue ve Genetik Yatknlk)in tanmlayc statistikler (n=236)

    78

    Tablo 4.3. Prostat Kanseri Tans Durumuna Gre SrekliDeikenlerin (Ya ve PSA) Dalm

    79

    Tablo 4.4. Prostat Kanseri Tans Durumuna Gre KategorikDeikenlerin (Rektal Tue ve Genetik Yatkn.) Dalm

    80

    Tablo 4.5. Odds Oranlar (LRA) 82

    Tablo 4.6. Snflandrma Sonular-I (LRA) 82

    Tablo 4.7. Snflandrma Sonular-II (LRA) 82

    Tablo 4.8. Dzensizlik Matrisi Sonular (LRA) 83

    Tablo 4.9. Snflandrma Sonular-I (C&RT) 86

    Tablo 4.10. C&RT Snflandrma Sonular-II (C&RT) 86

    Tablo 4.11. Dzensizlik Matrisi Sonular (C&RT) 87

    Tablo 4.12. Snflandrma Sonular-I (YSA) 93

    Tablo 4.13. YSA Snflandrma Sonular-II (YSA) 93

  • vii

    Tablo 4.14. Dzensizlik Matrisi Sonular (YSA) 94

    Tablo 4.15. Dm 0 in Arlklar 94

    Tablo 4.16. Dm 1 in Arlklar 95

    Tablo 4.17. Dm 2 in Arlklar 95

    Tablo 4.18. Dm 3 in Arlklar 95

    Tablo 4.19. Dm 4 in Arlklar 96

    Tablo 4.20. Genel Karlatrma Tablosu 99

  • viii

    EKLLER LSTES

    Sayfa

    ekil 2.1. Veri Madencilii Modelleri 7

    ekil 2.2. Karar Aac Yaps 14

    ekil 2.3. Basit Bir Yapay Nron 22

    ekil 2.4. Basit Bir Yapay Sinir A 23

    ekil 2.5. Biyolojik Sinir Sisteminin Blok Gsterimi 24

    ekil 2.6. Biyolojik Sinir Hcresi 24

    ekil 2.7. Yapay Sinir Alarnn Genel Yaps 26

    ekil 2.8. Basit Alglayc Modeli 28

    ekil 2.9. Dorusal veya Lineer Fonksiyon 33

    ekil 2.10. Basamak Fonksiyonlar 34

    ekil 2.11. Tek kutuplamal Basamak Fonksiyonu 35

    ekil 2.12. ift Kutuplamal Basamak Fonksiyonu 35

    ekil 2.13. Paral Dorusal Fonksiyon 36

    ekil 2.14. Sigmoid Tipli Fonksiyon 37

    ekil 2.15. Tanjant Hiperbolik Tipli Fonksiyon 37

    ekil 2.16. Sins Tipli Fonksiyon 38

    ekil 2.17. Yapay Sinir Ann alma rnei 40

  • ix

    ekil 2.18. YSA de Kullanlan Geri Yaylml renmeAlgoritmas

    41

    ekil 3.1. Tek Arlk Katmanl Bir Yapay Sinir A 56

    ekil 3.2. Basit Bir Perseptron Mimarisi 59

    ekil 3.3. Tek Gizli Katmanl leri Beslemeli ok Katmanl BirYapay Sinir A

    62

    ekil 3.4. ok Katmanl Alglayc 63

    ekil 3.5. Tek Gizli Katmanl leri Beslemeli ok Katmanl BirYapay Sinir A

    64

    ekil 3.6. Geri Yaym Mant 67

    ekil 4.1. Rektal Tue sonularnn dalm 79

    ekil 4.2. Genetik Yatknlk sonularnn dalm 79

    ekil 4.3. Prostat Kanseri Tans Koyulan Hastalarn Rektal TueSonular

    80

    ekil 4.4. Prostat Kanseri Tans Konulmayan (Normal) HastalarnRektal Tue Sonular

    80

    ekil 4.5. Prostat Kanseri Tans Koyulan Hastalarn GenetikYatknlk Durumlar Dalm

    81

    ekil 4.6. Prostat Kanseri Tans Konulmayan (Normal) HastalarnGenetik Yatknlk Durumlar Dalm

    81

    ekil 4.7. LRA in ROC Erisi 83

    ekil 4.8. Ya in Yanl Snflandrmalarn Gsterimi (LRA) 84

    ekil 4.9. PSA in Snflandrma Hatalarnn Gsterimi (LRA) 84

    ekil 4.10. Rektal Tue in Snflandrma Hatalarnn Gsterimi(LRA)

    85

    ekil 4.11. Genetik Yatknlk in Snflandrma HatalarnnGsterimi (LRA)

    85

    ekil 4.12. C&RT in ROC Erisi 87

  • xekil 4.13. C&RT - Algoritmas in Aa Gsterimi 90

    ekil 4.14. Ya in Yanl Snflandrmalarn Gsterimi (C&RT) 91

    ekil 4.15. PSA in Yanl Snflandrmalarn Gsterimi (C&RT) 91

    ekil 4.16. Rektal Tue in Yanl Snflandrmalarn Gsterimi(C&RT)

    92

    ekil 4.17. Genetik Yatknlk in Yanl SnflandrmalarnGsterimi (C&RT)

    92

    ekil 4.18 YSA iin ROC Erisi 94

    ekil 4.19 Yapay Sinir A Modeli 96

    ekil 4.20 Ya in Yanl Snflandrmalarn Gsterimi (YSA) 97

    ekil 4.21 PSA in Yanl Snflandrmalarn Gsterimi (YSA) 97

    ekil 4.22 Rektal Tue in Yanl Snflandrmalarn Gsterimi(YSA)

    98

    ekil 4.22 Genetik Yatknlk in Yanl SnflandrmalarnGsterimi (YSA)

    98

  • xi

    KISATMALAR ve SMGELER

    C&RT Snflandrma ve Regresyon Aac

    YSA Yapay Sinir Alar

    LRA Lojistik Regresyon Analizi

    ROC Receiver Operating Characteristic Curve (Alc lemKarakteristikleri Erisi)

    AUC ROC erisi altnda kalan alan (Area under the ROCCurve)

    VM Veri Madencilii

    CHAID (Chi-Squared Automatic Interaction Detector: OtomatikKi-Kare Etkileim Belirleme),

    MARS (Multivariate Adaptive Regression Splines: okDeikenli Uyumlu Regresyon Uzanmlan),

    QUEST (Quick, Unbiased, Efficient Statistical Tree: Hzl, Yansz,Etkin statistiksel Aa),

    SLIQ (Supervised Learning in Quest),

    SPRINT (Scalable Parallelizable Induction of Decision Trees)

    ID3 Iterative Dichotomiser 3

  • 11. GR ve AMA

    Gnmzde teknolojinin hzl geliimi ile tm sektrlerden elde edilen veri

    miktar devasa boyutlara ulam ve verilerin toplanmas, saklanmas, ilenmesi gibi

    problemler ortaya kmtr. yle ki bugn dnyadaki bilgi miktarnn her yirmi ayda

    bir ikiye katland kabul edilmektedir. Bu problemlere, gelien bilgisayar teknolojileri,

    kapasitesi ve ilem gc artan donanmlar ve yazlmlar ile birlikte zm sunmaya

    almtr. Bu zmlerinde en nemlisi veri tabanlar alanndaki ilerlemelerdir. Ancak

    veritaban sistemlerinin artan kullanm ve hacimlerindeki olaanst art, iletmeleri

    toplanan verilerden nasl faydalanlabilecei problemi ile kar karya brakmtr. Veri

    miktar arttka bu verilerin insanlarca anlalmas zorlam; veriler ierisinde sakl

    kalm yararl bilginin elde edilmesi ve Karar Destek Sistemi erevesinde kullanm,

    herhangi bir ara kullanmakszn olanaksz hale gelmitir. Geleneksel sorgu veya

    raporlama aralarnn veri ynlar karsnda yetersiz kalmas, veri madencilii ve veri

    madencilii altnda yaplan snflandrmalar gibi yeni araylara neden olmaktadr [1, 2,

    3].

    Snflandrma uygulamalarnda kullanlan pek ok model ve bu modellere ait

    farkl algoritmalar vardr. Bu algoritmalardan hangisinin daha efektif sonular rettii,

    hangi algoritmann hangi alanda daha baarl olduu sorusuna verilen cevaplar

    uygulamalarn baarmn arttracak ve yaplan iin verimini arttracaktr. Bu sebeple

    algoritmalarn karlatrlarak deerlendirilmesi byk nem arz etmektedir. ok

    sayda algoritma olmas, her algoritmann kendi iinde farkl parametrelerle almas,

    her algoritmann birden ok versiyonunun bulunmas, farkl algoritmalarn farkl amaca

    ynelik olmas, kullanlan veri kaynann farkl olmas, algoritmalarn farkl veri

  • 2tiplerini desteklemesi ve veri zerinde yaplan nilemlerin uygulaycya bal olmas

    gibi sebeplerle farkl sonular elde edilmitir [1, 2, 4, 12, 13, 15].

    Baml deikenlerin kategorik yapda olduu veri setlerinin analizinde

    bamsz deikenlerin baml deiken zerindeki etkilerini deerlendirmek ve

    birimlerin baml deikenin kategorilerine gre en az hata ile snflandrlmas iin

    kullanlan Snflandrma ve Regresyon Aalar (C&RT); Yapay Sinir Alar (YSA) ve

    Lojistik Regresyon Analizi (LRA) yntemlerinin karlatrlmas yaplm ve

    birbirlerine gre avantaj ve dezavantajlar incelenmitir. Yntemlerin karlatrlmas

    iin gerek bir veri seti ve karlatrma iin ak kaynak koda sahip bir istatistik

    program olan Weka (Waikato Environment for Knowledge Analysis Ver.3,6,5)

    program kullanlmtr.

    Snflandrma ve Regresyon Aalar (C&RT); ikili karar aac oluturan bir

    yntemdir. Aataki her bir noda, her bir bamsz deiken iin geliim skoruna dayal

    olarak en iyi kesim noktas ya da en iyi kategori gruplar oluturulur. Snflandrma ve

    Regresyon Aalarnda ama baml deiken ile ilgili verilerin mmkn olduunca

    homojen alt setlerinin meydana getirilmesidir. C&RT, kategorik yapdaki baml

    deikenler iin genellikle Gini indeksi kullanarak en iyi kestirici deiken seerek aa

    yapsn oluturur [3, 4, 14].

    Yapay Sinir Alar insan beynindeki sinir alar gibi alarak elle zm

    olana vermeyen son derece karmak yapya sahip problemlerin zmn salayan

    ve deiken yaps konusunda herhangi bir kstlama getirmeksizin deikenler aras

    ilikiyi ortaya koyan ok esnek bir yntemdir. YSA, zellikle snflandrma problemleri

    iin yaygn ekilde kullanlmaktadr. YSA, geriye yaylma algoritmasn kullanarak a

  • 3hatasn minimize ederek birimlerin en az hata ile snflarna atanmas iin an

    arlklarn adm adm hesaplar [5 ,6, 7, 16, 18].

    Lojistik Regresyon Analizi ise baml deikenin kategorik ve bamsz

    deikenlerin kark lekli olmas durumunda belirli bir dalm varsaymna baml

    kalmakszn baml deiken ile bamsz deikenler arasndaki neden-sonu

    ilikisinin belirlenmesinde kullanlan bir yntemdir. LR, en ok olabilirlik tahmin

    yntemini kullanarak veri setinden elde edilen olasl maksimum yapan bilinmeyen

    parametre deerleri tahmin eder. Bylece olabilirlik fonksiyonunu maksimum yapan

    parametre tahminleri seilir ve gzlenen veri ile en iyi rten parametre tahminleri elde

    edilir [3, 4, 17].

    Literatr taramas yapldnda bu almada seilen snflandrma

    ynteminin genellikle ikili varyasyonlar ile karlalmtr. Tarama sonucunda gncel

    almalar tercih edilmi olup bunlardan bazlar aada zetlenmitir.

    Gneri ve ark.[4] baar snflandrmasnda lojistik regresyon ve sinir alar

    yaklam sonucunda elde edilen doru snflandrma oranlarn karlatrdklarnda

    verilerin doru snflandrma olaslklar lojistik regresyon uygulamas ve sinir alar

    yaklam iin %95.17 olarak bulunmutur. ki yntemin ayn sonucu vermi olmas

    sinir alarnn atama problemlerinde kullanlabilirliini gstermitir.

    Kurt ve ark.[5] yapt almada, rencilerin alkol kullanmn etkileyen

    faktrler lojistik regresyon analizi (LR) ve yapay sinir alar (YSA) ile incelenmitir.

    Bu yntemlerin alkol kullanan ve kullanmayan rencileri ayrmadaki etkinlikleri ROC

    erisi yntemiyle karlatrlm. Sonu olarak LR, modelin parametre tahminleri ve

    OR deerleri hakknda bilgi vermesi ve sonularnn kolay yorumlanabilir olmas

    asndan YSAdan daha avantajl olduu grlmtr. Bu nedenle eer uygulama

  • 4sonucunda YSAnn snflandrma performans LRden kt ise LR modeli tercih

    edilmeli; eer YSAnn performans LRden daha iyi ise nemsiz deikenlerin

    modelden karlmasnda LR, YSA iin bir n eleme yntemi olarak kullanlmaldr

    sonucuna varlmtr.

    Ocakolunun[6] yapt almada, lojistik regresyon analizi ve yapay sinir

    alarnn snflama etkinliklerini karlatrmay amalamaktadr. Lojistik regresyon

    analizi ve yapay sinir alar yntemleri, bireylerin snflandrma oranlarna gre

    karlatrlmtr. Buna gre YSA modelleri ile snflandrmann LRA kullanlarak

    yaplan snflandrmadan daha iyi sonular verme eiliminde olduu ayrca yine ar

    eitme, mimarinin hatal oluturulmas vb. problemleri olmayan YSA modellerinin daha

    iyi ngr performans salayabildii grlmtr.

    Karakn[7] yapt almada, meme kanseri hastalarnn koltuk alt lenf nod

    durumlarn belirleyen SLNB ve AD ameliyatlar olmakszn, her hastanede kolaylkla

    elde edilebilir olan klinik ve patolojik verilerinin girildii YSA nn, hastalarn koltuk

    alt lenf nod durumunu belirlemesi amalanmtr. alma iin Ankara Numune Eitim

    ve Aratrma Hastanesi ve Ankara Onkoloji Eitim ve Aratrma Hastanesine bavuran

    ve meme kanseri 270 kiinin verileri kullanlmtr. ok katmanl ileri yaylml yapay

    sinir a modeli sonular regresyon ve korelasyon katsaylarna baklarak

    deerlendirilmitir. Ayn zamanda tbbi almalarda tp testlerinin doruluklarn tespit

    amal kullanlan ROC analizi ile elde edilen eitim ve test veri sonularnn belirlilik,

    duyarllk ve doruluk sonular deerlendirilmitir. YSAnn sonularnn kyaslanmas

    iin lojistik regresyon yntemi kullanlmtr. Lojistik regresyon ile hangi verilerin

    anlaml olduuna baklm, anlaml olan verilerle yapay sinir a tekrar eitilmi ve test

  • 5edilmitir. Lojistik regresyon ve seilen YSA modelleri kyaslandnda YSA deerleri

    daha baarl olduu grlmtr.

    Krann[8] yapt almada, veri madencilii yntemleri ierisinde snflama

    ve regresyon modellerinden en ok kullanlan karar aalar ile lojistik regresyonun

    snflama zellikleri karlatrlarak gerek bir veri seti zerinde uygulama yaplm ve

    sz konusu iki yntemin baarsn gstermek amalanmtr. Sonuta her iki modelin %

    90n zerinde snflandrma baars gsterdii dikkat ekerken, C&RT ynteminin

    daha yksek snflandrma baarsna sahip olduu tespit edilmitir. Bu noktadan

    hareketle C&RT ve lojistik regresyon analizi ile yaplan almalarda hata riskini en aza

    indirmek amacyla C&RT ynteminin kullanlmas daha uygun bulunmutur.

    King ve ark.[39] sembolik renme (C&RT, C4.5, NewID, ITrule,Cal5, CN2),

    istatistik (Naive Bayes, k-en yakn komuluk, kernel younluk, dorusal ayrma, karesel

    ayrma, lojistik regresyon, Bayes Alar) ve yapay sinir alar (geri yaynm - merkez

    tabanl uzaklk fonksiyonu) yntemleri arasnda karlatrma yapmlardr. Bu

    yntemleri be adet resim, iki adet tp, ikier mhendislik ve finans veri kmeleri

    zerinde uygulamlardr. Daha iyi sonular reten algoritmann, zerinde aratrma

    yaplan veri kmesine bal olduu sonucuna ulamlardr ve rnek olarak iki

    kategorili deikenlerde gzlenme orannn %38in zerinde olduu veri kmelerinde

    sembolik renme algoritmalarnn daha verimli sonular rettiini belirtmilerdir.

    Sabzecari ve ark.[10] zel bir bankann kredi derecelendirme amal veri kmesi

    zerinde uyguladklar veri madencilii yntemlerini karlatrmlardr. Bankalar,

    kredi verirken, veri madencilii yntemleri ile kredi bavurusunda bulunan mterileri

    deerlendirerek mteriye kredi verilmesinin uygun olup olmadn belirlemektedirler.

    Sabzecari ve ark. Probit ve lojistik regresyon, C&RT, yapay sinir alar, bagging ve

  • 6MARS algoritmalarn karlatrarak sonularn deerlendirmilerdir. Olduka kk

    bir veri kmesi zerinde yaptklar bu alma sonucunda istatistiksel modeller

    arasndan lojistik regresyon ve makine renme modelleri arasndan da bagging

    modelinin daha baarl sonular rettiini ifade etmilerdir.

    Zurada ve ark.[11] salk endstrisinde kt kredilerin belirlenmesinde

    karlatrdklar yapay sinir alar, karar aalar, lojistik regresyon, hafza-tabanl

    sebepleme ve btnletirilmi model arasnda karlatrlma yapmlardr. Sonuta

    yapay sinir alarnn, lojistik regresyon algoritmasnn ve btnletirilmi modelin daha

    iyi kesinlik oranna sahip sonular rettiini, karar aalarnn ise iyi kredi

    snflandrmasn daha yksek bir doruluk derecesiyle tespit ettiini belirtmilerdir.

  • 72. GENEL BLGLER

    Veri Madenciliinde kullanlan modeller, temel olarak ekil 2.1de grld

    zere tahmin edici (predictive) ve tanmlayc (descriptive) olmak zere iki ana balk

    altnda incelenmektedir [26].

    ekil 2.1. Veri Madencilii Modelleri

    Tahmin edici modellerin amac, verilerden hareket ederek bir model gelitirmek

    ve kurulan bu model yardmyla sonular bilinmeyen veri kmelerinin sonu

    deerlerini tahmin etmektir. Eer tahmin edilecek deiken srekli bir deikense

    tahmin problemi regresyon, kategorik bir deikense snflama problemi olarak

    nitelendirilmektedir [2]. Tanmlayc modellerde ise karar vermeye rehberlik etmede

    kullanlabilecek mevcut verilerdeki rntlerin tanmlanmas salanmaktadr.

    Veri Madencilii modelleri fonksiyonlarna gre ise;

    Snflama (Classification) ve Regresyon,

    Kmeleme (Clustering),

  • 8 Birliktelik kurallar (Association Rules) eklinde snflandrlmaktadr.

    ekil 2.1de gsterilen veri madencilii modellerinden snflama ve regresyon

    modelleri tahmin edici, kmeleme, birliktelik kurallar ve ardk zamanl rntler ise

    tanmlayc modellerdir [1].

    2.1. SINIFLAMA VE REGRESYON MODELLER

    Veri madencilii yntemleri ierisinde en yaygn kullanma sahip olan, byk

    veri kmelerini snflandrarak nemli veri snflarn ortaya koyan veya gelecek veri

    eilimlerini tahmin etmede faydalanlan yntemlerden bir tanesi snflama ve regresyon

    modelleridir.

    Veri madenciliinin en nemli alanlarndan biri olan kmeleme, nesneleri

    birbirlerine olan benzerliklerine gre gruplara ayrmaktadr. Yani kmeleme

    modellerinde ama, kme yelerinin birbirlerine ok benzedii ancak zellikleri

    birbirlerinden ok farkl olan kmelerin bulunmas ve veri tabanndaki kaytlarn bu

    farkl kmelere blnmesidir. Bylece nesneler, rneklenen kitle zelliklerini iyi

    yanstan etkili bir temsil gcne sahip olacaktr [1,2,3].

    Snflama en ok bilinen veri madencilii yntemlerinden birisidir; resim, rnt

    tanma, hastalk tanlan, dolandrclk tespiti, kalite kontrol almalar ve pazarlama

    konulan snflama yntemlerinin sklkla kullanld alanlardr. Snflama tahmin edici

    bir model olup, havann bir sonraki gn nasl olaca veya bir kutuda ka tane mavi top

    olduunun tahmin edilmesi bir snflama ilemidir [27]. Matematiksel olarak snflama;

    D = {t1,t2,...,tn} bir veri taban ve her bir ti bir kayt (gzlem),

    C = {Cl,C2,...,Cm} ise m adet snftan oluan snflar kmesini temsil etmek

    zere,

  • 9 f : D C ve her bir ti bir snfa dahildir. Ayrca her bir Cj ayr bir snftr ve her

    bir snf kendisine ait kaytlar ierir. Yani,

    C j = { t i l f { t i ) = C j,\

  • 10

    belli bir veri zellii seilerek algoritmann bu kt zellii deerlerine ulamak iin

    hangi girdi zelliklerinin bir arada olmas gerektiini aa veri yaplar eklinde

    kefetmesi salanr [28].

    Karar aalar, basit karar verme admlar uygulanarak, ok sayda kayt ieren

    bir veri kmesini ok kk kayt gruplarna blmek iin kullanlan bir yapdr [29].

    Her baarl blme ilemiyle, sonu gruplarnn yeleri bir dieriyle ok daha benzer

    hale gelmektedir.

    Bu teknikte snflandrma iin bir aa oluturulur, daha sonra veri tabanndaki

    her bir kayt bu aaca uygulanr ve kan sonuca gre de bu kayt snflandrlr. Karar

    aalar veri setinin ok karmak olduu durumlarda bile, baml deikeni etkileyen

    deikenleri ve bu deikenlerin modeldeki nemini basit bir aa yaps ile grsel

    olarak sunabilmektedir [8,28].

    Karar aac yntemini kullanarak verinin snflanmas temel olarak iki admdan

    olumaktadr. Birinci adm; nceden bilinen bir eitim verisinin model oluturmak

    amac ile snflama algoritmas tarafndan zmlendii renme basamadr.

    renilen model, snflama kurallar veya karar aac olarak gsterilir. kinci adm ise

    eitim verisinin snflama kurallarnn veya karar aacnn doruluunu belirlemek

    amacyla test edilerek kullanld snflamadr. Eer doruluk kabul edilebilir oranda

    ise, kurallar yeni verilerin snflanmas amacyla kullanlr [8].

    Karar aac algoritmalarn bir probleme uygulayabilmek iin aadaki

    koullarn salanmas gerekir:

    Olaylarn zelliklerle ifade edilebilmesi gerekir. Nesnelerin belli sayda zellik

    deerleriyle ifade edilebilmesi gerekir. rnein; souk, scak vb. zelliklerin

    srekli ve ya kesikli olmas fark etmez.

  • 11

    Snflar belirleyebilmek iin gereken ayrc zelliklerin olmas gerekir. Karar

    aac, adnda belirtildii ekilde aa grnmnde bir tekniktir. Karar

    dmleri, dallar ve yapraklardan oluur [19].

    Karar aalarnn kk, dallar ve yapraklardan oluan aaca benzeyen bir yaps

    olup, rnekteki tm gzlemleri kapsayan bir kk ile balayp aaya doru inildike

    veriyi alt gruplara ayran dallara ayrlrlar. Bu kkten dallara doru byyen aa

    yapsnda her boum dm dr, oluan aalarda homojen olmayan dmlere

    yavru dm (child node), homojen dmlere ise terminal dm (parent node)

    ad verilir [30]. Dmler zerinde niteliklerin test ilemi yaplmakta ve test ileminin

    sonucu aacn veri kaybetmeden dallara ayrlmasna neden olmaktadr. Her dmde

    test ve dallara ayrlma ilemleri ardk olarak gereklemekte ve sonu olarak aa

    snflar ile son bulmaktadr.

    Dm: Veriye uygulanacak test tanmlanr. Her dm bir zellikteki testi

    gsterir. Test sonucunda aacn dallar oluur. Dallar olutururken veri kayb

    yaanmamas iin verilerin tmn kapsayacak sayda farkl dal oluturulmaldr.

    Dal: Testin sonucunu gsterir. Elde edilen her dal ile tanmlanacak snfn

    belirlenmesi amalanr. Ancak daln sonucunda snflandrma tamamlanamyorsa tekrar

    bir karar dm oluur. Karar dmnden elde edilen dallarn sonucunda

    snflandrmann tamamlanp tamamlanmad tekrar kontrol edilerek devam edilir.

    Yaprak: Daln sonucunda bir snflandrma elde edilebiliyorsa yaprak elde

    edilmi olur. Yaprak, verileri kullanarak elde edilmek istenen snflandrmann

    snflarndan birini tanmlar [30].

    Karar aacnda, tanmlanm olan soruya ilikin cevap gruplara ayrlmaktadr.

    Cevaplar soruya verilecek bir lt belirlendikten sonra setler arasndaki riski

  • 12

    maksimize edecek ekilde blnmekte ve en iyi blnmeyi bulmak iin her soruda ayn

    ilem tekrar edilmektedir. Bir soru iin grup oluturulduktan ve gruplar arasndaki risk

    maksimize edildikten sonra oluan iki grup iin bu ilemler devam ettirilmektedir. Bu

    ilemlere istatistiksel olarak anlaml bir fark bulunana kadar devam edilmekte,

    istatistiksel olarak anlaml bir fark bulunmadnda ise son verilmektedir. Ayrtrma

    ilemi tamamlandktan sonra ise o grup ierisinde yer alan gzlemlerin oranna gre

    grup deerlendirilmektedir [31].

    Karar aalarnn oluturulmas aa oluturma ve aa budama

    basamaklarndan oluur.

    Aa oluturma: Veri kaynandaki btn nesneleri ieren kk dmden

    balar, yinelemeli olarak her dmde var olan nesneleri seilecek olan bir nitelie gre

    farkl dallara ayrarak btn nesneleri snflandracak ekilde yaprak dmlere blene

    kadar, ya da ayrm yapc bir nitelik kalmayana kadar devam eder. Snama

    dmlerinde eldeki nesnelerin hangi nitelie gre alt dmlere blndnde en ok

    verimin alnacan bulmak ve dallanmay bu nitelie gre yapmak algoritmann gcn

    arttrr. Nesneler alt dmlere blndnde alt dmlerdeki nesnelerin trdelii ne

    kadar yksek olursa o dmdeki dallanma o kadar verimli olur. Bu sebeple, her

    dmde, snamas yaplacak olan nitelik (o dmdeki nesneleri alt dmlere

    bldnde) homojenite bakmndan en yksek kazanc salayacak nitelik olarak seilir

    [8,31].

    Aa Budama: Aa oluturma basama, verileri tamamen ayn snf

    yelerinden oluan yapraklara blnceye ya da karlatracak nitelik kalmayncaya

    kadar blmeler. Bu algoritmann sonucu olarak, ok derin ya da ok az deneme kmesi

    rnei ieren yaprak dmlere sahip aalar oluabilir. Byle bir aac renme

  • 13

    kmesi zerinde test edince elbette ki doruluu ok yksek sonular verir. Ancak

    byle bir model henz grlmemi rneklerle karlarsa ok kt doruluklu sonular

    retebilir. Byle bir model verimli deildir ve veriyi genellemekten uzaktr. Byle bir

    modelin sahip olduu bu zellie ar uyum (overfitting) denir. Ar uyum bir

    modelde istenmeyen bir sonutur [27,31].

    An uyum genelde verideki grltden (hatal snf deeri, yanl deerli

    deikenler) kaynakland gibi problem alannn karmaklndan ya da rastgelelikten

    kaynaklanabilir.

    Ar uyumu azaltmak iin aalarda budama ilemi uygulanr. Budama ilemi,

    baz dallarn ya da alt dallarn kaldrlarak o dala ait nesnelerin youn olduu snfla

    etiketlenmi yaprak dmlerle yerletirilmesiyle gerekletirilir. Aa oluturulurken

    erken-dur yntemiyle erken-budama yaplabilecei gibi aa oluturulduktan sonra

    budama ge-budama yaplabilir. Ge-budama ynteminin daha baarl olduu

    bilinmektedir. Zira erken-budama yntemi hatal sonulara yol aabilir, nk henz

    dallanma yaplmam bir dal budandnda, aacn o noktadan sonra ne ekil alm

    olaca o aamada bilinmemektedir. Ancak ge-budama yaplrken aa zaten olumu

    bulunmaktadr ve hangi dallarn aslnda gereksiz olduu, an uyum yaratt

    bilinmektedir. Ge-budama yaplrken dmlerdeki beklenen hata deerine baklr.

    Eer bir dmdeki beklenen hata miktar, o dme ait alt dallardaki beklenen hata

    miktarndan kk olursa alt dallar budanr [31,32].

    D = {t1,...,tn} bir veri taban olmak zere, t t , t i={t1...tin} den ve bu veri taban

    {A 1 ,A 2 , . . . ,A n } alanlarndan olumaktadr.

    Bunun dnda C = {C1,...,C} kadar da snf verilmi olduunda,

    Her bir dm At alanyla tanmlanm,

  • 14

    Her dmden ayrlan kollar bu alanla ilgili bir soruya yant veren,

    Her yapran bir snf olduu karar aac ekil 2.2da gsterilmitir [27].

    ekil 2.2. Karar Aac Yaps

    ekil 2.2de grlen karar aacndaki A1, A2 ,..., An den her biri bir dm

    oluturmakta ve her dm kendinden sonra iki dala ayrlmaktadr. Bu ayrlma ilemi

    srecinde, Ai dm hakknda cevab veri tabannda bulunacak bir soru sorulmakta ve

    verilen yanta gre de bir dal izlenmektedir. Aataki C1 ,C2 ,...,Cn lerin her biri birer

    yapra ayn zamanda snf temsil etmektedirler.

    Karar aalar oluturulurken kullanlan algoritmann ne olduu nemli bir

    husustur. Kullanlan algoritmaya gre aacn ekli deiebilir. Bu durumda deiik aa

    yaplar da farkl snflandrma sonular verecektir. Kk denilen ilk dm oluturan

    Ai nin farkl olmas, en utaki yapraa ularken izlenecek yolu ve dolaysyla

    snflandrmay da deitirecektir [27].

  • 15

    Deikenlerin seiminde yinelemeli olan algoritmann dngden kmas iin o

    dmdeki tm elerin ayn snfa dhil olmas art vardr. Eer kalan deerler sadece

    bir snfa aitse veya snflandrlabilecek deer kalmadysa dngsel algoritma sonlanr

    ve karar aac oluturulmu olur. Sonuta oluan snflardaki her bir eleman ayn snfn

    dier elemanlar ile benzer zellikler gsterir. Aa yaps heterojen yapdaki veri

    kmesinin daha kk ve homojen bir yapya dnmesi iin kurallar tanmlar. Aa

    inas sonunda elde edilen aa maksimum aa olarak adlandrlr ve renme

    kmesindeki deney nitelerine en uygun aatr. Ancak maksimum aa pratikte iki

    dezavantaja sahiptir [32].

    Maksimum aa balang veri setini (renme kmesini) kusursuz biimde

    tanmlar nk eklenen her bamsz deiken hatal snflama orann drr.

    Bu durumda, maksimum aa veri iin olmas gerekenden daha iyi bir tahmin

    modeli sunar. Ancak, balang veri setine ar uyumlu maksimum aalar

    farkl bir veri seti sz konusu olduunda iyi bir tahmin salayamazlar.

    Bir snflama aacnn karmaklk ls o aacn terminal dm saysna

    eittir. Terminal dm saylar ve dolaysyla karmakl yksek olan

    maksimum aacn anlalmas ve yorumlanmas gtr.

    Maksimum aacn pratikte ortaya kard bu sorunlarn zm iin

    maksimum aacn budanmas gereklidir. Maksimum aacn budanmas daha kk

    aalar dizisi oluturur ve oluturulan bu dizi ierisinden optimum aa seilir.

    Optimum aa maksimum aatan daha az karmakla sahiptir ancak renme

    kmesine maksimum aatan daha az uyumludur ve hatal snflama oran da daha

    yksektir [27,31,32].

  • 16

    Karar aacnn kurulmas iin kullanlacak girdi olarak bir dizi kayt verilirse bu

    kaytlardan her biri ayn yapda olan birtakm zellik/deer iftlerinden oluur. Bu

    zelliklerden biri kaydn hedefini belirtir. Ama, hedef-olmayan zellikler kullanlarak

    edef zellik deerini doru kestiren bir karar aac belirlemektir. Hedef zellik

    ounlukla sadece {evet, hayr}, veya {baarl, baarsz} gibi ikili deerler alr [19].

    Bir karar aac ne bildiimizi (rn., renme verisi) zetledii iin deil, yeni

    durumlarn snflamasn doru yapt iin nemlidir.

    Karar aac tekniini kullanarak verinin snflanmas aamadan oluur.

    renme: nceden sonular bilinen verilerden (eitim verisi) model

    oluturulur.

    Snflama: Yeni bir test verisi kmesi modele uygulanr, bu ekilde karar

    aacnn doruluu belirlenir. Test verisine uygulanan bir modelin doruluu,

    yapt doru snflamann test verisindeki tm snflara orandr. Her test

    rneinde bilinen snf, model tarafndan tahmin edilen snf ile karlatrlr.

    Uygulama: Eer doruluk kabul edilebilir oranda ise, karar aac yeni verilerin

    snflanmas amacyla kullanlr [33].

    Test verisini en iyi ekilde dallara ayran zellik tespit edilerek, bu zellik karar

    aacnn oluturulmasnda daha nce seilir. Bylece daha iyi bir karar aac

    oluturulur. En iyi dallara ayran zelliin tespitinde eitli ltler gelitirilmitir.

    Bu ltlerin baz rnekleri unlardr:

    p(i | t), i snfna ait verilerin, verilen bir t dmndeki blnmesini gstersin.

    c snf saysdr ve entropi hesaplamasnda 0 log2 0 = 0 eklinde dnlmtr.

    c-1

    Entropi(t) = p(i | t) log2p(i | t), (2.1)

  • 17

    i=0

    Entropi bir dmn ne kadar bilgi verici olduunu lmede kullanlr. Bu yi

    ile ne kastedildiini belirtir. Bu kavram Claude Shannon tarafndan ilk kez Bilgi Teorisi

    iinde tanmlanmtr.

    c-1

    Gini(t) = 1 [p(i | t)]2, (2.2)

    i=0

    Snflandrma hatas(t) = 1 maxi[p(i | t)],

    Karar aac oluturulduktan sonra, kkten yapraa doru inilerek kurallar

    belirlenir. Ancak ok sayda dal ve dmden oluan karar aalarnda kurallarn

    belirlenmesi zorlar. Karar aac modelini daha okunabilir hale getirmek iin kurallarn

    yazmnda IF-THEN (Eer-ise-O Zaman) biiminde artl ifadeler kullanlr. IF (Eer-

    ise) ksm daln sonuna giden yol zerindeki tm testleri ierirken THEN (O Zaman)

    ksm son snflamay gsterir. IF THEN yapsndaki kurallara Karar Kurallar (Decision

    Rules) denir [18,22].

    Karar aalar, model kurulumu ve sonularnn yorumlanmasnn kolay olmas,

    veritaban sistemleri ile kolayca entegre edilebilmeleri ve gvenilirliklerinin iyi olmas

    nedenleri ile snflama modelleri ierisinde en yaygn kullanma sahip tekniktir [34].

    Karar aalarnn gl ynleri aadaki gibi zetlenebilir:

    Karar aalar anlalabilir kurallar retirler.

    Karar aalar ar hesaplamaya gerek kalmadan snflandrma yaparlar.

    Karar aalar hem srekli ve hem de kesikli deikenler iin uygundur.

    Karar aalar snflandrma ve kestirim iin hangi alanlarn en nemli

    olduunu ak biimde gsterir [35].

  • 18

    Karar aalarna dayal olarak gelitirilen birok algoritma vardr. Bu

    algoritmalar kk, dm ve dallanma kriteri seimlerinde izledikleri yol asndan

    birbirlerinden ayrlrlar. Karar aac oluturmak iin gelitirilen bu algoritmalar

    arasnda;

    CHAID (Chi-Squared Automatic Interaction Detector: Otomatik Ki-Kare

    Etkileim Belirleme),

    C&RT (Classification and Regression Trees: Snflama ve Regresyon Aalar),

    MARS (Multivariate Adaptive Regression Splines: ok Deikenli Uyumlu

    Regresyon Uzanmlar),

    QUEST (Quick, Unbiased, Efficient Statistical Tree: Hzl, Yansz, Etkin

    statistiksel Aa),

    SLIQ (Supervised Learning in Quest),

    SPRINT (Scalable Parallelizable Induction of Decision Trees)

    ID3, C4.5 ve C5.0 yer almaktadr.

    2.1.2. Yapay Sinir Alar

    nsanlarn beynin almasn saysal bilgisayarlar zerinde taklit etmek istemesi

    sonucunda yapay sinir alar ortaya kmtr. Temelde beynin alma yaps, insanlar

    gibi dnen ve renen sistemler elde etme fikrinin olmas, almalar insan beynini

    oluturan hcrelerin incelenmesi zerine younlatrmtr. Bu almalar esnasnda her

    bir nronun dier nronlar ile ilikili olduu ve ald baz girdileri ktya

    dntrd gzlemlenmitir. Gnmzde yapay sinir alan olarak adlandrlan bu

    alan, birok nronun belirli kurallar erevesinde bir araya gelerek bir ilevin

  • 19

    gerekletirmesi esnasndaki yapsal, matematiksel ve felsefi sorunlara cevap bulmaya

    alan bir bilim dal olmutur [45].

    YSA kavram beynin alma ilkelerinin saysal bilgisayarlar zerinde taklit

    edilmesi fikri olarak ortaya km ve ilk almalar beyni oluturan biyolojik

    hcrelerin, ya da literatrdeki ismi ile nronlarn matematiksel olarak modellenmesi

    zerinde younlamtr [46].

    Yapay sinir a, beynin belirli bir ii veya fonksiyonu yerine getirme yntemini

    modelleyen bir makinedir. An yaps, elektronik sistemler veya bilgisayar yazlmlar

    ile tanmlanmaktadr. Tanmlanan bu model, sinir hcresi veya ilem birimi ad verilen

    hcreler arasndaki balanty kullanmakta ve bu ilemler esnasnda renme ad verilen

    bir sre ile performansn artrabilmektedir. Bu noktada yapay sinir a kavramn

    deneysel bilgi saklama ve kullanma hazr hale getirme yeteneine sahip basit ileme

    birimlerinden oluan, ok youn, paralel ve datlm dzende alan bir ilemci

    olarak tanmlamak mmkndr. nsan beyni ile benzerlii ise bilgiyi renme yoluyla

    elde etmesi ve bilginin depolanmas iin sinir hcreleri aras ba kullanmasdr [47].

    2.1.2.1. Yapay Sinir A Nedir?

    Bir yapay sinir a, biyolojik sinir alarnn karakteristiklerine benzer

    karakteristiklere sahip bir bilgi ileme sistemidir. YSA, insann idrak etmesi ve

    biyolojik nron yapsnn matematiksel modelinin aadaki kurallar varsaylarak

    genelletirilmesi sonucunda oluturulmutur [48]:

    Bilgi ileme, nron ad verilen birok basit elemanlarda gerekleir;

    Sinyaller, nronlar arasndaki ilikiyi salayan balantlarla iletilir;

  • 20

    Her bir balantnn bir arlk deeri vardr ve bu deer, gerek nronlarda

    olduu gibi sinyal geiini retmektedir;

    Sinir a iindeki her bir nrona ayn bir aktivasyon fonksiyonu uygulanr

    (genelde bu dorusal olmayan bir fonksiyondur) ve bu fonksiyonun k deeri

    sayesinde nronun k sinyali hesaplanr;

    Herhangi bir yapay sinir a;

    Nronlar arasndaki bantnn bir modeli yani mimarisi ile,

    Balantlardaki arlklarn hesaplanmas (bu hesaplama, eitim kural ya da

    renme algoritmas olarak da adlandrlr) ile,

    Aktivasyon fonksiyonu ile tanmlanabilir.

    Yapay sinir alarnn karakteristik zellikleri uygulanan a modeline gre

    deimektedir. Ancak tm modeller iin genel zellikler unlardr: [49]

    Yapay sinir alar makine renmesi gerekletirirler.

    Programlar alma stili bilinen programlama yntemlerine

    benzememektedirler.

    Bilgiyi saklarlar.

    rnekleri kullanarak renirler.

    Gvenle altrlabilmeleri iin nce eitilmeleri ve performanslarnn test

    edilmesi gerekmektedir.

    Grlmemi rnekler hakknda bilgi retirler. Bunu genelleme zellii sayesinde

    yaparlar.

    Alglamaya ynelik olaylarda kullanlabilirler.

    ekil ilikilendirme ve snflandrma yapabilirler.

  • 21

    rnt tamamlama gerekletirebilirler.

    Kendi kendine organize etme ve renebilme yetenekleri vardr.

    Eksik bilgi ile alabilmektedirler.

    Hataya ve grltye kar duyarlla ve toleransa sahiptirler.

    Belirsiz, tam olmayan bilgileri ileyebilmektedirler.

    Dereceli bozulma (Graceful degradation) gsterirler.

    Datk bellee sahiptirler. Veri datlm birleik hafza yaps kullanlr ve

    bilgi farkl formlara dntrlerek ilenebilir.

    Sadece nmerik bilgiler ile alabilmektedirler [49,50].

    Bir yapay sinir a, nron, birim, hcre ya da dm olarak adlandrlan ok

    saydaki basit ilem birimlerinden oluur. Her bir nron, dier bir nrona belli bir

    arlk deerine sahip olan haberleme balantlaryla balanr. Arlklar, yapay sinir

    ann bir problemi zmesi iin gerekli olan bilgiyi hazrlamaktadr. YSA ok eitli

    problemlerin zmnde kullanlabilirler. rnek olarak, bilgileri ve numuneleri

    saklamada ve onlar daha sonra tekrar tanmada, numuneleri snflandrmada, giri

    numunelerinin k numunelerine dntrlmesinde, benzer rneklerin

    gruplandrlmasnda ya da doal olmayan optimizasyon problemlerinin zmlerinin

    bulunmasnda ve daha pek ok alanda YSA ok geni bir biimde kullanlabilir [50].

    rnek olarak ekil 2.3de gsterilen bir Y nronunu dnelim. Bu nron X1,X2

    ve X3 nronlarndan giri sinyallerini alr. Bu nronlarn aktivasyonlar yani k

    sinyalleri, srasyla x1,x2 ve x3 tr. Balantlar zerindeki arlklar X1,X2 ve X3

    nronlarndan Y nronuna doru srasyla w1,w2 ve w3 tr. A girii olan y _ in deeri

  • 22

    X1,X2 ve X3 den Yye giden arlkl sinyallerin toplamdr. y _ in deeri aadaki

    eitlikteki gibi hesaplanr [50].

    y _ in=w1x1+ w2x2+ w3x3 (2.3)

    ekil 2.3. Basit Bir Yapay Nron

    Y nronunun aktivasyonu y, aa giri deerlerinin bir fonksiyonu olarak

    tanmlanr.

    y=f(y _ in)

    Bu fonksiyon, S-biimli sigmoid fonksiyon olabilir. Sigmoid fonksiyonun formu

    aada verildii gibidir.

    1( )1 exp( )

    f xx

    = + - (2.4)

    Bu fonksiyonu, dier aktivasyon fonksiyonlarndan biri de olabilir.

  • 23

    Y nronunun Z1 ve Z2 nronlarna v1 ve v2 arlklaryla baland

    varsaylsn. Bu durum, ekil 2.4de gsterilmektedir. Y nronu y sinyalini dier

    birimlere gnderir. Bununla birlikte, genel olarak Z1 ve Z2 nronlar tarafndan alnan

    sinyaller farkl olmaktadr; nk her bir sinyal aktarld balantda bulunan v1 ve v2

    arlklar ile orantldr. Z1 ve Z2 nin aktivasyonlar olan z1 ve z2 deerleri, sadece tek

    bir nrona bal deildir. Onlar birbirinden farkl birden fazla nrondan gelen sinyallere

    baldr.

    ekil 2.4 deki yapay sinir a basit olmasna ramen, gizli birimin grnm ve

    dorusal olmayan aktivasyon fonksiyonu sayesinde birok problemi zebilir. Baka bir

    ynden gizli bir birime sahip yapay sinir ann retilmesi yani arlklarn optimal

    deerlerinin bulunmas olduka zordur [6].

    ekil 2.4. Basit Bir Yapay Sinir A [6]

  • 24

    2.1.2.2. Biyolojik Sinir Alar

    ekil 2.5. Biyolojik Sinir Sisteminin Blok Gsterimi

    Biyolojik sinir sistemi verinin alnmas, yorumlanmas ve karar retilmesi gibi

    ilevlerin yrtld beyni merkezde bulunduran 3 katmanl bir yapdr. Uyarlar alc

    sinirler ile birlikte elektriksel sinyallere dntrlerek beyne iletilir. Beynin

    oluturduu ktlar ise, tepki sinirleri tarafndan belirli tepkilere dntrlr.

    ekil 2.6. Biyolojik Sinir Hcresi [5,47]

    Sinir a yapsnda bilgilerin alc ve tepki sinirleri arasnda ileri ve geri

    beslemeli olarak deerlendirilmesi ve sonucunda tepkilerin olumas, kapal bir evrim

    srecine benzemektedir. Temel ilem eleman sinir hcreleridir. nsan beyninde

  • 25

    yaklak 10 milyar sinir hcresi olduu tahmin edilmektedir. ekil 2.6 da gsterildii

    gibi sinir hcreleri; hcre gvdesi, gvdeye giren alc lifler (dentrit) ve gvdeden kan

    sinyal iletici lifler (akson) olmak zere 3 temel bileenden meydana gelir.

    Dentritler aracl ile bilgiler dier hcrelerden hcre gvdesine iletilir.

    Hcrelerde oluan ktlar ise akson yardm ile bir dier hcreye aktarlr. Aktarmn

    gerekletii bu noktada aksonlarda ince yollara ayrlabilmekte ve dier hcrenin

    dentritlerini oluturmaktadrlar. Akson-dentrit bantsn olutuu bu noktalara sinaps

    ad verilir [5,47].

    Sinapsa ulaan ve dentritler tarafndan alnan bilgiler genellikle elektriksel

    darbelerdir, fakat bu bilgiler sinapstaki kimyasal ileticilerden etkilenirler. Hcrenin

    tepki oluturmas iin bu tepkilerin belirli bir srede belirli seviyeye ulamas

    gerekmektedir. Bu deer eik deeri olarak adlandrlr [23,47].

    YSAlar, insan beyninin alma prensibi rnek alnarak gelitirilmeye

    allmtr ve aralarnda yapsal olarak baz benzerlikler vardr [52]. Bu benzerlikler

    Tablo 2.1de ve istatistiksel terimler yapay sinir alar terimleri arasndaki terminolojik

    ilikiler de Tablo 2.2 de verilmitir [50].

    Tablo 2.1. Biyolojik Sinir Hcresi

    Sinir Sistemi Yapay Sinir A

    Nron lemci Eleman

    Dentrit Girdiler

    Hcre Gvdesi Transfer Fonksiyonu

    Akson Yapay Nron k

    Sinaps Arlklar

  • 26

    Tablo 2.2. statistiksel Yntemler le Yapay Sinir Alarnn Benzeimi

    statistik Yapay Sinir A

    Model A

    Tahmin renme

    Regresyon Danmal renme

    nterpolasyon Genelletirme

    Gzlem renme Algoritmas

    Parametre A Parametreleri

    Bamsz Deiken Giri Verileri

    Baml Deiken k Verileri

    Snr Regresyonu Arlk Budama lemi

    2.1.2.3. Yapay Sinir Alarnda Genel Yap

    ekil 2.7. Yapay Sinir Alarnn Genel Yaps

  • 27

    Girdi Katman: Girdi katman en az bir girdi elemannn bulunduu blmdr.

    Girdi katmannda veriler herhangi bir ileme tabi tutulmadan girdileri ile ayn deerde

    kt retirler.

    kt Katman: kt katman en az bir ktdan oluur ve kt a yapsnda

    bulunan fonksiyona baldr. Bu birimlerde girdi katmannda olann aksine ilem

    gerekletirilir ve birimler kendi ktlarn retirler.

    lem Katman: Genellikle "Kara Kutu" olarak adlandrlr. Girdi birimlerinin

    belirli ilemlere tabi tutulduu blgedir. Seilen a yapsna gre ilem katmannn

    yaps ve fonksiyonu da deiebilir. Tek bir katmandan oluabilecei gibi birden fazla

    katmandan da oluabilir [47].

    2.1.2.4. Yapay Sinir Hcresi

    Biyolojik sinir alarnn yap bileenleri sinir hcreleridir benzer ekilde yapay

    sinir alarnn da yapay sinir hcreleri bulunmaktadr (ekil 2.8). YSA, insan sinir

    andaki gibi nronlardan ve onlar arasndaki balantlardan oluur. Bilgi, a tarafndan

    bir renme sreciyle evreden elde edilir. Elde edilen bilgileri biriktirmek iin sinaptik

    arlklar olarak da bilinen hcreler aras balant gleri kullanlr [53].

  • 28

    ekil 2.8 Basit Alglayc Modeli [53]

    YSAya bilgi saysal olarak d dnyadan, dier hcrelerden ya da kendi

    kendisinden gelebilir. Sinir hcresine bilgiler arlklar yoluyla tanrlar. Arlk

    deerleri bilginin nemini ifade eder, deiken ya da sabit deerler olabilirler, pozitif ya

    da negatif deerler alabilirler. Bir sinir hcresine gelen net bilgi yaygn olarak toplama

    fonksiyonu araclyla hesaplanr. Her girdi deeri kendi arl ile arplr. Toplama

    fonksiyonu tm girdiler iin gelen bu deerleri toplayarak net hcre ktsn hesaplar.

    Her hcre dier hcrelerden bamsz olarak bu net deerini hesaplar. Sapma (bias-bk)

    deerinin aktivasyon fonksiyonuna giren deeri ykseltme ya da drme etkisi vardr.

    Aadaki eitlikte kullanlan xj; gelen bilgileri, wkj her girdi deerine ait arlklar, bk

    sapma deerini, vk nronun kt deerini ifade etmektedir [7].

    1

    m

    k kj j kjV w x b

    == S + (2.5)

    Aadaki eitlikte grld gibi her sinir hcresinin net bilgisi eik deerine

    sahip bir aktivasyon fonksiyondan geirilerek gerek bir kt oluturulur. Genellikle

    kullanlan aktivasyon fonksiyonlar eik, sigmoid, hiperbolik tanjant vb.

  • 29

    fonksiyonlardr. Aktivasyon fonksiyonu ((.)) genellikle dorusal olmayan bir

    fonksiyondur.

    ( )k ky vj= (2.6)

    YSA herhangi bir konu ile ilgili veri setleriyle eitilirken eitim algoritmalar

    kullanrlar. renilmesi istenen olay iin oluturulan eitim seti aa sunulurken hedef

    kt deerleri de aa sunulabilir. Sadece girdi seti aa sunulabilir, sistemin kendi

    kendine renmesi istenilebilir ya da her girdi seti iin sistemin kendisinin bir kt

    retmesi salanabilir. retilen ktnn doru ya da yanl olduunu gsteren sinyal

    retilerek, bu sinyale gre sistem eitime devam edilebilir [54].

    2.1.2.5. Yapay Sinir Ann Temel Elemanlar

    Yapay sinir alar aadaki varsaymlar zerine kurulmutur: [55]

    Bilgi ileme nron olarak isimlendiren basit elemanlarda gerekletirilir

    aretler nronlar arasndaki balantlardan geer

    Her balant birok iareti tayan bir arla sahiptir

    Her nron kendi giri deerine k iaretini belirlemek iin aktivasyon

    fonksiyonu uygular.

    Yapay sinir alar, birbirine bal ok sayda ilemci elemanlardan olumu,

    genellikle paralel ileyen yaplar olarak adlandrlabilir. Yapay sinir alarndaki ilem

    elemanlar (dmler) basit sinirler olarak adlandrlrlar. Bir yapay sinir a birbirine

    balantl, ok sayda dmlerden oluur.

    Yapay sinir alar insan beyni gibi renme, hatrlama ve genelleme yeteneine

    sahiptirler.

  • 30

    nsan beyninde renme 3 ekilde olur;

    Yeni aksonlar reterek,

    Aksonlarn uyarlmasyla,

    Mevcut aksonlarn glerini deitirerek.

    Her aksonun zerinden geen iaretleri deerlendirebilecek yetenekte olduu

    savunulmaktadr. Aksonun bu zellii, bir iaretin belli bir sinir iin ne kadar nemli

    olduunu gstermektedir [48].

    2.1.2.5.1. Giriler

    Giriler tarafndan bir yapay sinir hcresine bir baka yapay sinir hcresinden

    veya d dnyadan bilgi al yaplr. Bunlar an renmesi istenen rnekler tarafndan

    belirlenir.

    2.1.2.5.2. Arlklar

    Arlklar bir yapay sinir hcresinin girileri tarafndan alnan bilgilerin nemini

    ve hcre zerinde etkisi gsteren uygun katsaylardr. Her bir giri iin bir arlk vardr.

    Bu arln byk olmas bu giriin nemli olduu ya da arln kk olmas giriin

    nemsiz olduunu gstermez. Bir arln deerinin sfr olmas o a iin en nemli

    olay olabilir. Eksi deerler de yine giriin nemsiz olduunu gstermez. Arln art

    ve eksi olmas giriin etkisinin pozitif ya da negatif olduunu gsterir. Arlklar

    deiken ya da sabit olabilirler [56].

  • 31

    2.1.2.5.3. Toplama levi

    Toplama ilevi bir yapay sinirdeki her bir giri ile o girie ait olan arln

    arplarak bu arpmlarn toplanmasdr.

    n

    i iiNet Toplam x w= S

    (2.7)

    Ancak birok uygulama aadaki gibi eik deeri olan da bu toplamaya

    katlmtr.

    n

    i ii

    NetToplam x w q= + ya dan

    i ii

    NetToplam x w q= - (2.8) eik deerinin girilerden bamsz olduu iin btn girilerin sfr olmas

    durumunda k deerinin sfr deil de eik deerine eit olduu grlr ki bu da,

    belirtilen artlar altnda nron knn sfr olmas zorunluluunu ortadan kaldrr. Eik

    deerinin kullanm, toplama fonksiyonuna +1 ya da -1 deerine sahip sabit bir giriin

    arlna sahip bir balant ile eklendii eklinde yorumlanr [48].

    Ayrca her model ve her uygulama iin bu toplama fonksiyonun kullanlmas

    art deildir. Baz modeller, kullanlacak toplama fonksiyonunu kendileri belirler. ou

    zaman daha karmak olan deiik toplama fonksiyonlar kullanlr. Bunlar Tablo 2.3de

    gsterilmitir. Baz durumlarda girilerin deeri nemli olurken, bazlarnda says

    nemli olabilir. Bir problem iin en uygun toplama fonksiyonunu belirlemek iin bir

    forml gelitirilememitir. Bu yzden en uygun toplama fonksiyonunun bulunmas

    deneme yanlma yoluyla belirlenir. Ayrca ayn problem iin kullanlan yapay sinir

    hcrelerinden hepsi ayn toplama fonksiyonunu kullanabilecei gibi her biri iin farkl

    toplama fonksiyonu kullanlabilir [48].

  • 32

    Tablo 2.3 Toplama Fonksiyonu rnekleri Toplama levi

    Toplama levi Aklama

    arpm

    i iiNet Girdi x w= P

    Giriler ve arlklar arplr sonra bu

    deerler de birbiriyle arplr.

    Maksimum (En ok)

    ( ), 1,2,...,i iNet Girdi Max x w i N= =

    N adet giri ve arlk birbiriyle

    arpldktan sonra en by net girdi

    olarak kabul edilir.

    Maksimum (En az)

    ( ), 1, 2,...,i iNet Girdi Min x w i N= =

    N adet giri ve arlk birbiriyle

    arpldktan sonra en k net girdi

    olarak kabul edilir.

    ounluk

    sgn( )i iiNet Girdi x w= S

    N adet giri ve arlk birbiriyle

    arpldktan sonra pozitif ve negatif

    olanlarn says bulunur. Bunlardan

    byk olan net girdi olarak alnr.

    Kmltif Toplam

    ( ) ( )i iiNet Girdi Net eski x w= + S

    Hcreye gelen bilgiler arlkl olarak

    toplanr ve daha nce gelen bilgilere

    eklenerek hcrenin net girdisi bulunur.

    2.1.2.5.4. Etkinlik levi (Aktivasyon Fonksiyonu)

    Yapay nronun davrann belirleyen nemli bir etken aktivasyon

    fonksiyonudur. Buna ayn zamanda renme erileri de denir. Aktivasyon fonksiyonu

    hcreye gelen net girdiyi, dier bir deyile toplama fonksiyonunu ileyerek bu hcreye

    gelen girilere karlk olan k belirler.

    Aktivasyon fonksiyonu da yapay sinir alarnn farkl modelleri iin farkl

    olabilir. En uygun aktivasyon fonksiyonunu belirlemek iin gelitirilmi bir fonksiyon

    yoktur. Toplama fonksiyonuna benzer ekilde hcrelerin hepsi iin ayn aktivasyon

  • 33

    fonksiyonu kullanma zorunluluu yoktur. Bazlar ayn aktivasyon fonksiyonunu

    kullanrken bazlar kullanmayabilir [48].

    Baz modeller iin zellikle de ok Katmanl Alglayc model iin bu fonksiyon

    trevi alnabilir ve srekli olmaldr. Yapay sinir alarnn kullanm amacna gre tek

    veya ift ynl aktivasyon fonksiyonu kullanlabilir.

    Dorusal olmayan fonksiyonlarn kullanlmas yapay sinir alarnn ok

    karmak ve farkl problemlere uygulanmasn salamtr. En ok kullanlan aktivasyon

    fonksiyonlar unlardr [23,26,29,48,53]:

    2.1.2.5.4.1. Dorusal Fonksiyon

    Dorusal fonksiyon, hcreye gelen girileri olduu gibi ka verir.

    Fonksiyonun ekli ekil 2.9da verilmitir. ounlukla ADALINE olarak bilinen

    dorusal modelde, klasik iaret ileme ve regresyon analizinde kullanlr. Denklemi;

    n

    i ii

    v x w= veyan

    i ii

    v x w q= + olmak zere;

    ( )y F v Av= = (2.9)

    Formldeki A sabit katsaysdr.

    ekil 2.9. Dorusal veya Lineer Fonksiyon

  • 34

    2.1.2.5.4.2. Basamak Fonksiyonu

    Basamak fonksiyonu tek veya ift kutuplu olabilir. Bu fonksiyonlarn ekli ekil

    2.10de, matematiksel ifadeleri de aada verilmitir. Perceptron (Basit Alglayc

    Model) olarak bilinen yapay sinir hcresi aktivasyon fonksiyonu olarak bu fonksiyonu

    kullanr.

    1 0( )

    0 0v

    y F vv = =

  • 35

    ekil 2.11. Tek kutuplamal Basamak Fonksiyonu

    ift kutuplu basamak fonksiyonu ise;

    1 . 0( )

    1 . 0w x

    y F vw x

    + = = -

  • 36

    fonksiyon basamak fonksiyonu gibi davranr. Aadaki denklem fonksiyonu, ekil

    2.13de grafii gsterilmitir.

    0 1/ 2( ) 1/ 2 1/ 2

    1 1/ 2

    vy F v v v

    v

    aa a

    a

    = = +

  • 37

    ekil 2.14. Sigmoid Tipli Fonksiyon

    2.1.2.5.4.6. Tanjant Hiperbolik Tipli Fonksiyon

    Uygulamalarda ok kullanlan aktivasyon fonksiyonlarndan biri de Tanjant

    Hiperbolik fonksiyondur. Bu fonksiyon ift kutuplu fonksiyon olarak da bilinir. Giri

    uzaynn geniletilmesinde etkin bir ekilde kullanlan bir fonksiyondur. Fonksiyonun

    ekli ekil 2.15de forml ise aadaki gsterildii gibidir.

    2

    2

    1 tanh( )1

    v

    v

    ey ve

    b--= =

    + (2.15)

    ekil 2.15. Tanjant Hiperbolik Tipli Fonksiyon

  • 38

    2.1.2.5.4.7. Sins Tipli Fonksiyon

    renilmesi dnlen olaylar sins fonksiyonuna uygun dalm gsteriyorsa

    bu gibi durumlarda aktivasyon fonksiyonu olarak sins fonksiyonu kullanlr.

    Fonksiyonun ekli ekil 2.16de ve forml aada verilmitir.

    ( ) ( )y f v Sin v= =(2.16)

    ekil 2.16. Sins Tipli Fonksiyon

    Bir yapay sinir ann bu 5 temel eleman dnda zaman zaman ihtiya

    duyulduunda kullanlan bir eleman daha vardr. Bu eleman lekleme ve snrlama

    olarak adlandrlr.

    2.1.2.5.5. k levi

    ks y = f(v), aktivasyon fonksiyonunun sonucunun d dnyaya veya dier

    sinirlere gnderilmesidir. Bu sinirin ks kendine ve kendinden sonra gelen bir ya da

    daha fazla sayda sinire giri olabilir.

    2.1.2.6. A Girilerinin Hesaplanmas in Matris arpma Metodu

  • 39

    Sinir alarnn balantl arlklarn W = (wij) matrisinde kaydedelim. Bu

    halde, Yj nin a girdisi x = ( x1,..., xi, ...,xn) vektrnn w.j arlk matrisinin j. kolonu

    ile (eer j. elemanda sapma yoksa) basit bir arplmas ilemi ile gerekletirilir :

    1

    . 1_ . .j i ijiy in x w x w== = S (2.17)

    Sapma

    Sapma deeri, x vektrne x0 = 1 deeri eklenerek oluturulabilir.

    x = (l, x, ..., xi, ..., xn)(2.18)

    Sapma ayn dier arlklar gibi davramr, yani w0j = bj dir. Yj birimi iin a

    girdisi u ekilde hesaplanr:

    . 01 1 1

    _ . . . .n n n

    j j i ij j i ij j i iji i

    y in x w x w w x w b x w+= =

    = = = = + (2.19)Bir YSA dmnn grevi, giriindeki saylar kendi arlk deerleri ile

    arpp, sonra da bu arpmlar toplayp, toplam bir yumuatma fonksiyonundan

    (genelde sigmoid 1( )1 x

    f xe-

    = + veya tanh) gerdkten sonra ka vermektr. Ancak

    giri ve k katmanndaki nronlar bu kuraln dndadr. Giri katmanndaki nronlar

    ise sadece kendi girilerindeki verilerin uygun arlklarla arplm durumlarn

    toplayp saklarlar. Bu ileme ilerleme denir [58,60].

    2.1.2.7. Yapay Sinir Hcresinin alma Prensibi

    ekil 2.17da girileri ve arlklar verilmi olan bir yapay sinir hcresinin

    almas yledir:

  • 40

    ekil 2.17. Yapay Sinir Ann alma rnei

    Hcreye gelen net girdi, arlklarla giriler arplarak aadaki gibi hesaplanr.

    NET Girdi = 0.7 * 0.2 + 0.4 *(-0.2) + 0.3*0.1

    NET Girdi = 0.14 - 0.08 + 0.03

    NET Girdi = 0.09

    Hcrenin sigmoid tipli aktivasyon fonksiyonuna gre k y=f(v) yledir;

    y = f(v) = 1 / (1+e-0.09)

    y = 0.52

    Sonuta verilen girdilere karlk yukardaki ilemler sonucunda y k deeri

    bulunur.

  • 41

    ekil 2.18 YSA de Kullanlan Geri Yaylml renme Algoritmas

  • 42

    2.1.3. Lojistik Regresyon Analizi

    Lojistik regresyon; baml deikeninin kategorik ve ikili, l ve oklu

    kategorilerde gzlendii durumlarda bamsz deikenlerle neden sonu ilikisini

    belirlemede yararlanlan bir yntemdir. Bamsz deikenlere gre baml

    deikeninin beklenen deerlerinin olaslk olarak elde edildii bir regresyon

    yntemidir. Basit ve oklu regresyon analizleri baml deiken ile bamsz deiken

    ya da deikenler arasndaki matematiksel banty analiz etmekte kullanlmaktadr. Bu

    yntemlerin uygulanabilecei veri setlerinde baml deikenin normal dalm

    gstermesi, bamsz deikenlerinde normal dalm gsteren toplum ya da

    toplumlardan ekilmi olmas ve hata varyansnn ),0(2se N@ parametreli normal

    dalm gstermesi gerekmektedir. Bu ve benzeri koullarn yerine getirilmedii veri

    setlerinde basit ya da oklu regresyon analizleri uygulanamaz. Lojistik regresyon

    analizi, snflama ve atama ilemi yapmaya yardmc olan bir regresyon yntemidir.

    Normal dalm varsaym, sreklilik varsaym n koulu yoktur. Baml deiken

    zerinde bamsz deikenlerin etkileri olaslk olarak elde edilerek risk faktrlerinin

    olaslk olarak belirlenmesi salanr [11,18,19,25].

    Aratrclar zerinde altklar konuda ok etken olmas durumunda etkenlerin

    tek tek baml deiken zerine etkisi yannda, bunlarn birlikte etkisini de renmek

    ya da incelemek istemektedirler. Birlikte etkinin incelenmesinde kullanlan deiik

    istatistik yntemler bulunmaktadr. rnein, baml deikenin srekli, bamsz

    deikenlerin kesikli olmas durumunda varyans analizi, hepsinin kesikli olmas

    durumunda log-linear modeller, hepsinin srekli olmas durumunda regresyon analizi

    gibi. Tp alanndaki aratrmalarda ou zaman baml ve bamsz deikenlerin tr

    ve yaplar yukarda belirtilenlere benzemez, srekli ve kesikli karm bamsz

  • 43

    deikenlerle karlalr. zerinde en ok durulan ve aratrc iin nemli olan dier

    bir konu da etken veya etkenlerle hastalk arasndaki ilikinin risk ynnden

    incelenmesidir. Bu tip incelemelerde arlkl olarak LRA kullanlmaktadr [20,41].

    Lojistik regresyon modelinin kullanmna ilikin ilk almalar Berkson (1944)

    tarafndan yaplm ve model Finney (1972) tarafndan biyolojik deneylerde probit

    analize bir alternatif olarak nerilmitir . Son yllarda youn bir ekilde kullanlan LRA,

    gzlemlerin gruplara atanmasnda sk kullanlan yntemden (dierleri kmeleme

    analizi ve ayrma analizi) birisidir. LRA da grup says bilinmekte, mevcut veriler

    kullanlarak bir ayrmsama modeli elde edilmekte ve kurulan bu model yardmyla veri

    kmesine eklenen yeni gzlemlerin gruplara atanmas mmkn olabilmektedir [42].

    Dorusal regresyon analizinde baml deikenin deeri tahmin edilirken, LRA

    da baml deikenin alaca deerlerden birinin gerekleme olasl tahmin edilir.

    Bu olaslk deerinin tahmininde aadaki model kullanlmaktadr.

    ( )0 1

    0 11

    x

    x

    exe

    b b

    b bp+

    += + (2.20)

    Lojistik regresyon modeliyle tahmin yaplaca genel olarak kullanlan yntem

    en ok olabilirlik metodudur. Genel anlamda en ok olabilirlik metodu, gzlenen veri

    kmesini elde etmenin olasln maksimum yapan bilinmeyen parametrelerin

    deerlerini tahmin etmede kullanlr. Bu metodu uygulayabilmek iin en ok olabilirlik

    fonksiyonunun oluturulmas gerekmekte ve ilgili parametrelerin en ok olabilirlik

    tahmincileri, fonksiyonu maksimum yapacak deerleri bulacak ekilde seilmelidir [6].

    LRA da gzlenen deerlerle tahmin edilen deerler aadaki ifadeyle

    karlatrlr.

    2ln Su andaki ModelinolabilirligiDDoymus Modelinolabilirligi

    = - (2.21)

  • 44

    Modelde bulunan herhangi bir bamsz deikenin nemliliine karar vermek

    iin denklemde o bamsz deikenin bulunduu ve bulunmad durumlardaki D

    deerleri, G istatistii kullanlarak karlatrlrlar. G istatistii p serbestlik derecesiyle

    ki-kare dalm gsterecektir.

    G = D(Deikensiz model iin) - D(Deikenli model iin)

    2ln Degiskensiz ModelinolabilirligiDDegiskenli Modelinolabilirligi

    = - (2.22)

    Katsaylarn nemlilikleri test edildikten sonra katsaylarn yorumlanmas odds

    oranlar kullanlarak yaplmaktadr. LRA nn kullanm amalarndan en nemlisi tp

    biliminde sklkla karlalan baml deikenin iki ya da daha ok dzey ierdii,

    bamsz deikenlerin ise hem kesikli hem de srekli olabildii durumlarda verilerin

    ait olduklar gruplara en doru ekilde atayacak ve hastalklara ilikin risk faktrlerini

    belirleyebilecek modeli kurmaktr. Bunun yannda lojistik regresyon, baml

    deikenin tahminini olaslk olarak hesaplayarak olaslk kurallarna uygun snflama

    ilemi yapma olana vermektedir [20,23,43].

    2.1.3.1. Lojistik Snflandrma ve Lojistik Regresyon Modeli

    Baml deikenin 0.1 deerlerine karlk gelen G1 ve G2 gruplar x1,x2,...,xp

    bamsz deikenlerine dayanlarak snflandrlmak istensin. Gruplardaki birey says

    sra ile n1 ve n2 olduunda, N=n1+n2 gzleme dayal snflandrma kuralnn oluumu

    fs(x1,x2,...,xp) eklindeki olaslk fonksiyonunun fonksiyonel yapsna ilikin

    varsaymlara dayanr. Fonksiyon yaps iin tr varsaym sz konusudur [13,14,44].

    i. ok deikenli normal dalm fonksiyonu

    ii. Lojistik snflandrma fonksiyonu

  • 45

    iii. Dalmdan bamsz kernel snflandrma fonksiyonu

    Lojistik snflama fonksiyonu sz konusu olduunda X0=l iken fs(x1,x2,...,xp),

    Gs(s=l,2) grubunun olaslk younluk fonksiyonu olarak tanmlanr. Lojistik varsaym,

    '=( o, ...., p) iin,

    1 1

    2 2

    ( ) ( )exp( ) ln( ) ( )

    f x f xX ya da Xf x f x

    b b = = (2.23)

    eklinde tanmlanmaktadr. Bu son eitlik log-olabilirlik oram olup x ler

    dorusaldr. Lojistik varsaym bilinmeyen P parametrelerini iermektedir. Her bir

    gzlem iin X koulu altnda gruplardan birine atanma olasl olarak tanmlanan

    sonsal olaslklar hesaplamak iin P tahminleri gerekmektedir. Bunun iin lojistik

    varsaym altnda rneklemin olabilirlik fonksiyonu belirlenmelidir. Kark

    rneklemede gzlemler (X,G) bileik dalmndan rneklenmekte yani gzlemler hangi

    gruptan olduu bilinmeksizin rasgele seilmektedir. Buradan G grup yeliini gsteren

    deiken olup iki grup olduunda G1 ve G2 eklinde gsterilmektedir [44].

    Koullu rneklemede G nin x koulu altnda dalm incelenmektedir.

    Biyolojik deneylerin analizinde ok sk kullanlan bu rnekleme trne ilikin

    olabilirlik fonksiyonu dier rnekleme trlerinin olabilirlik fonksiyonuna temel tekil

    etmektedir. Ayr rnekleme de ise x in G koulu altnda dalmndan rnekleme

    yaplmaktadr. Anderson (1972, 1982) tarafndan detayl olarak incelenen bu rnekleme

    trnn uygulamas zor olup gemie ynelik (retrospective) almalarda

    uygulanmaktadr [41].

    Regresyon problemlerinde anahtar deer, verilen bir bamsz deiken deerine

    bal olarak baml deikenin ortalama deerini bulmaktr. Bu deer koullu ortalama

    olarak adlandrlr ve E(Y \ x) ile gsterilir. Burada ynin baml deikeni, x in ise

  • 46

    bamsz deikeni gsterdii varsaylsn. E(Y\ x) ifadesi x deeri verildiinde, y nin

    beklenen deeri ni gstermektedir. Dorusal regresyon analizinde, koullu

    ortalamann, x in dorusal bir denklemi olduu varsaylr.

    0 1( \ )E Y x xb b= + (2.24)

    Yukardaki bu ifadeden, xin aralnn - ve + arasnda deimesinden dolay,

    E(Y\ x)in mmkn olan her deeri alabilecei grlmektedir. Baml deiken ikili

    olduu zaman koullu ortalama, sfrla bir arasnda deimek zorundadr [44].

    [0 < E(Y\ x ) 1]. x deki her birim deime sonucunda E(Y\ x)de oluan deiiklik,

    koullu ortalama 0a ya da 1e yaklatka ilerleyerek az olur.

    ki dzey ieren bir baml deikenin analizinde kullanlmak zere nerilen

    birok dalm fonksiyonu bulunmutur [6]. Lojistik dalm kullanldnda gsterimi

    kolaylatrmak iin, x bilindiinde Y nin koullu ortalamasn gstermek iin (x) =

    E(Y\ x) ifadesi kullanlmaktadr. Kullanlacak lojistik regresyon modelinin ak ekli

    aadaki gibidir [6,16,17,44].

    ( )0 1

    0 11

    x

    x

    exe

    b b

    b bp+

    += + (2.25)

    Lojistik regresyon almasna merkez olacak (x)in bir transformasyonu

    yukarda bahsedildii gibi lojit transformasyondur. Bu transformasyon (x)cinsinden

    tanmlanrsa:

    ( )( ) ln1 ( )

    xg xx

    pp

    = - 0 1xb b+= (2.26)

    Lojit g(x) parametreleri bakmndan dorusal ve xin ald deerlere bal

    olarak - ve + arasnda deimektedir [25].

  • 47

    2.2. PROSTAT KANSER

    2.2.1. Prostat Kanseri Hakknda Genel Bilgi

    Prostat kanseri erkeklerde en yaygn grlen kanser trdr ve ngiltere ve

    Gallerde yeni tan konulan kanser olgularnn %25ini tekil eder. Prostat bezesinin

    kt huylu tmr demek olan prostat kanseri, Robert Koch Enstitsnn en yeni

    tahminlerine gre Almanyada erkeklerde en sk rastlanan kanser hastaldr. 2000

    ylnda bu hastala ilk defa yakalananlarn says yaklak 40.000 kiiydi, yaklak

    11.000 kii de bu hastalk yznden hayatn kaybetti.

    Prostat kanserinin nasl ve neden ortaya kt sorusu bugne kadar tam olarak

    cevaplandrabilmi deildir. lke olarak ya ilerledike prostat kanseri riski de

    artmaktadr. 50 yan altndaki erkekler seyrek olarak hastalanr, en yksek hastalanma

    oranlar 70 yan stndeki erkeklerde grlmektedir.

    Kiinin kendi babas, erkek kardeleri veya byk babalar prostat kanserine

    yakalanm ise daha yksek bir risk var demektir. Bu nedenle kaltm yoluyla geme

    veya en azndan genlerden kaynaklanan bir hastalanma eiliminin mevcut olduu

    tahmin edilmektedir.

    te yandan prostat kanserine yakalanm olan erkeklerin % 80inde herhangi bir

    akrabada prostat kanseri grlmemitir. Beslenme biiminin de bir rol oynad

    ynnde iaretler vardr.

    2.2.2. Prostat Nedir?

    Prostat erkein en nemli cinsel salg bezesidir. Prostat bezesi, mesanenin (idrar

    torbasnn) idrar yoluna baland yerde, idrar borusunu epeevre saran bir organdr.

    Birok erkekte yan ilerlemesiyle prostatn idrar yolunun hemen yanndaki i

  • 48

    blmnde iyi huylu bir tmr oluur. Prostat 60 yandaki bir erkekte ortalama 30 ila

    40 ml byklktedir. Bu, yaklak iki ceviz bykl demektir. Bu iyi huylu ve prostat

    hiper plazisi (ar byme) ad verilen byme idrar yolunu daraltarak idrar yapmada

    zorluklara sebep olabilir.

    Buna karlk prostat kanseri ounlukla prostatn makattan (gden barsa

    veya rektum) parmakla eriilebilen d blmnde oluur. Prostat karsinomlarnn

    yaklak % 80i prostat bezesinin bu d blmnde ortaya kar. Prostat kanserinin

    prostat bezesinin i blmnde veya pubis kemiinin arkasnda yer alan n ksmnda

    olumas enderdir.

    2.2.3. Tehis

    pheli bir durum ortaya ktktan sonra prostat kanseri tehisi koyulabilmesi

    iin bir dizi muayene daha yaplmas gerekir. Bunlar:

    2.2.3.1. Prostatn Parmakla Muayenesi

    Prostat bezesi makattan (gden barsa veya rektum) parmakla yoklanarak

    muayene edilebilir. Normal olarak prostat (el gergin tutulduunda insann elinin ayas

    gibi) yumuak ve esnektir. Prostat kanseri ise ounlukla kemik gibi serttir. Bu sayede

    tecrbeli bir doktor prostat kanserini parmakla yoklayarak bulabilir ve dmn

    bykln tahmin edebilir. Eer parmakla yoklandnda bir dm hissediliyorsa

    tmr ounlukla prostat kapslne de yerlemi veya prostat kapsln delip gemi

    demektir.

    2.2.3.2. Prostata zg Antijenin Belirlenmesi (PSA)

    Prostat meni svsnn byk blmn reten organdr. Bu meni svs iinde

    meni svsn akkan hale getirmeye yarayan bir protein vardr. Sz konusu proteine

    prostata zg antijen denir, bunun ksaltmas da PSAdr. PSA normal artlar altnda da

  • 49

    kana karabilir ve kandaki miktar PSA testi ile llebilir. Ya ilerledike prostat

    bydnden kandaki PSA miktar da ykselir. Her gram iyi huylu prostat dokusu

    bana aa yukar 0,3 ng/ml antijen bulunur. Buna karlk prostat kanseri her gram

    doku bana yaklak 10 kere daha fazla PSA retir. Bu yzden PSA prostat kanserinin

    tehis edilebilmesi iin, yani tmr belirteci (tmr markeri) olarak kullanlmaya,

    uygundur.

    Tablo 2.4 Yaa zg Normal Serum PSA Deerleri

    YA PSA

    40-49 0-2,5 ng/ml

    50-59 0-3,5 ng/ml

    60-69 0-4,5 ng/ml

    70-79 0-6,5 ng/ml

    2.2.3.3. Makattan (rektum) Ultrason Muayenesi (TRUS)

    Ultrason muayenesi ile vcudun i organlarn, ua yk yklemeden

    grntlemek mmkn olmaktadr. Prostatn deerlendirilmesi iin makata (rektum

    veya gden barsa da denir) ufak bir ubuk biiminde bir sonda sokulur. Bylece

    prostatn yalnzca bykl ve biimi deil, prostatn doku yaps ve eer mevcutsa,

    kt huylu doku deiikliklerinin olup olmad da grlebilir. Ancak prostat kanseri

    iin tipik olan doku deiiklikleri ou kereler ancak byke tmr dmlerinde

    grlebilmektedir. Bunun tesinde, ultrason ile grntleme yntemi prostattan hedefli

    olarak doku alabilmek iin de gayet yararldr [62, 63, 64].

  • 50

    3. GERE ve YNTEM

    Uygulama verisi olarak, Tokat Gaziosmanpaa niversitesi Tp Fakltesi

    Hastanesinde 01.01.2005 tarihi ve 31.05.2011 tarihleri arasnda roloji Polikliniine

    bavuran hastalarn sonular alnmtr. Veritaban ynetim sistemi Oracle 10 GR2 olan

    hastane veritabanndan Structured Query Language (SQL) veritaban sorgu dili

    kullanlarak gerekli bilgiler ekilmitir. Belirtilen tarihler arasnda roloji Polikliniine

    bavurup muayenesi ve tetkikleri yaplp kesin tan olarak C61, Prostat malign

    neoplazm (prostat kanseri) tans konulan hastalarn muayene bilgileri incelenmitir.

    ncelenen muayene bilgileri ierisinde prostat kanserini tehis iin kullanlan drt faktr

    incelenmitir. Bu faktrler;

    i. Ya,

    ii. Prostatn parmakla muayenesi (rektal tue),

    iii. Genetik yatknlk bilgisi ve

    iv. PSA dzeyidir.

    ncelenen hastalardan kesin tans prostat kanseri olup muayene notlar ierisinde

    yukarda sralanan faktrlerin hepsinin bulunduu hastalar seilmitir. Bu ekilde

    yaplan tarama sonucunda 118 hasta verisi tespit edilmitir. Ayn ekilde muayene

    notlar ierisinde ya, rektal tue, genetik yatknlk ve PSA tetkik sonucu bulunan ama

    kesin tans C61, Prostat malign neoplazm (prostat kanseri) olmayan 118 hasta daha

    seilerek toplam 236 hastalk veri setine ulalmtr.

    Veri setinin WEKA programna yklenebilmesi iin arff formatnda olmas

    gerekmektedir. WEKA program Arff Viewer seenei ile .cvs uzantl dosyalar

    aabilmektedir. Bu nedenle, ncelikle MS Excel ortamda edinilen veriler .xls

  • 51

    formatndan .cvs (comma-separeted variables) (virglle ayrlm veriler) formatna

    dntrlmtr. Bu format trndeki veriler Ek-1de sunulmutur

    Veri madencilii algoritmalarndan Lojistik Regresyon Analizi (LRA), Yapay

    Sinir Alar (YSA) Ve Snflandrma Ve Regresyon Aalar (C&RT) yntemlerinin

    karlatrlmas iin prostat kanseri verileri kullanlmtr.

    3.1. C&RT ALGORTMASI

    Bilimsel almalardan elde edilen verilerin analizinde snflama ve regresyon

    aalar, kmeleme, ayrma ve lojistik regresyon analizlerini ieren snflama

    yntemleri ve regresyon modelleri sklkla kullanlmaktadr [36]. Ancak bu tr

    modellerin gerektirdii varsaymlar pek ok alanda istatistiksel analiz olanaklarn

    kstlamaktadr. ncelenen veri seti zerinde hibir varsaym gerektirmemesi nedeniyle,

    snflama ve regresyon aalar (C&RT) bu tr parametrik yntemlere kar gl bir

    alternatif olarak ortaya kmaktadr [32].

    Breiman ve arkadalar tarafndan 1984 ylnda gelitirilen ok saydaki

    aklayc (x) deikeni ile yant (y) deikenine karar vermede kullanlan istatistiksel

    bir tekniktir. C&RT hem kategorik hem de srekli deikenleri kullanarak snflama ve

    regresyon problemlerinin zmnde karar aalarn kullanan parametrik olmayan

    istatistiksel bir metottur. Ele alnan baml deiken kategorik ise yntem snflama

    aalar (Classification Tree), srekli ise regresyon aalar (Regression Tree) olarak

    adlandrlmaktadr [37]. Bu ynyle C&RT, hem oklu regresyon analizini hem de

    baml deikenin kategorik olduu durumlarda kullanlan lojistik regresyon analizini

    kapsamaktadr.

  • 52

    Yaplan almalarda kullanlan C&RT algoritmas, her aamada ilgili kmeyi

    kendinden daha homojen olan iki alt kmeye ayrarak ikili karar aalar oluturan bir

    yapya sahiptir. Dier bir ifadeyle C&RT, iki yavru dm oluturup btn bamsz

    deikenleri kullanarak veriyi alt gruplara ayrmak zerine kurulmutur. En iyi bamsz

    deiken safszlk (impurity) ve deiim llerindeki (gini, twoing, en kk kareler

    sapmas) deikenlii kullanarak seilir. Burada ama hedef deikene ilikin mmkn

    olabilen en homojen veri alt gruplarn retmektir [5].

    C&RT, sadece baml deiken ile bamsz deiken arasndaki ilikinin

    yapsn aratrmakla kalmayp, ayn zamanda bamsz deikenlerin birbirleri ile olan

    etkileimlerini de ortaya koymaya almaktadr. C&RT algoritmasnn, bamsz

    deikenlerin baml deikenle ilikisini deerlendirmede ve model iindeki etkileim

    yapsn zmlemede nemli avantajlar mevcuttur [37,38].

    C&RTn sahip olduu algoritma, benzerlik gsteren deikenlerin ayn aa

    dmnde toplanmasna dayal olup, btn oluturduu alt dallar baml deiken

    olan kk dme balamayla son bulmaktadr [38]. C&RT analizi genellikle 3 admdan

    olumaktadr. Birinci adm veri setini tanmlayan maksimum aacn oluturulmasdr.

    kinci adm; oluturulan aalar ierisinden baml deikenle nemli ilikisi olan

    aalar semek iin yaplan budama ilemi ve son adm ise en uygun aa yapsnn

    seimidir [37].

    3.1.1. Maksimum Aacn Oluturulmas

    Maksimum aa, aacn kknde balayan bir ikili blme ilemi kullanan

    yapdr. Aacn kk, veri seti ierisindeki her nesneyi iermekte ve her bir seviyede

    kendine zg iki alt dm halinde blnen bir ana dm olarak dnlmektedir.

  • 53

    Sonraki admda, her alt grup bir ana grup olmaktadr. Her blnme bir alt gruptaki tm

    nesnelerin benzer baml deiken deerlerine sahip olacak ekilde seilen bir

    aklaycnn deeri ile tanmlanmaktadr [37,38].

    Srekli deikenlerin blnmesi xinin seilmi bamsz deiken ve a jnin

    onun blnme deeri olan x i < aj ile ifade edilmektedir.

    Bir blnme ve onun blnme deeri iin en uygun tanmlaycy semek iin

    C&RT, iinde tm tanmlayclarn ve tm blnme deerlerinin dnld bir

    algoritma kullanmakta ve test koulunun ne kadar iyi uygulandn belirlemek iin ana

    dmn safszlk derecesini alt dmlerin safszlk derecesiyle karlatrmaktadr.

    Ana ve alt dmlerin safszlklar arasndaki fark ne kadar bykse test koulu o kadar

    daha iyi olduundan, ana dm (tp) ve alt dmler (tL ve tR) arasndaki safszlk

    lsn en iyi azaltan blnme seilmektedir. Matematiksel olarak bu durum aadaki

    gibi ifade edilmektedir [37]:

    i(s, tp ) = ip (tp ) - PLi(tL) - PRi(tR) (3.1)

    Burada i safszl, s aday blnme deerini ve PL ile PR srasyla sa ve soldaki

    alt dmlerdeki nesnelerin blnmelerini ifade etmektedir. Bu eitlikte i(s, t )

    deerini maksimize edecek s deerinin seilmesi amalanmakta ve tp dmnde

    btn kaytlarn katlmyla hesaplanan bu deer, C&RT aacnda gelime

    (improvement) kavram ile ifade edilmektedir. C&RT algoritmas aac gelitirirken

    i(s, tp ) yi maksimize eden bir test koulu setiinden ve ip(tp ) btn test koullar

    iin ayn olduundan, i(s, tp ) yi maksimize etmek alt dmlerin safszlk llerinin

    arlkl ortalamalarn minimize etmekle edeer olmaktadr [37].

  • 54

    Her bir dmn her aamada ikiye ayrld C&RT algoritmasnda, her bir

    blnme noktasnn belirlenmesinde Gini, Twoing gibi en iyi blmeyi semek iin

    gelitirilen sz konusu safszlk ltlerinden Gini indeksi kullanlmaktadr. Gini

    indeksi aadaki gibi hesaplanmaktadr [40].

    1) Her nitelik deerleri ikili olacak biimde gruplanmakta ve bu ekilde elde edilen

    sol ve sa blnmelere karlk gelen snf deerleri gruplandrlmaktadr.

    2) Her bir nitelikle ilgili olarak sol ve sa taraftaki blnmeler iin Ginisol ve

    Ginisa deerleri;

    k: Snflarn says,

    T: Bir dmdeki rnekler,

    Tsol: Sol dmdeki rneklerin says,

    Tsa: Sa dmdeki rneklerin says,

    Li: Sol dmde i kategorisindeki rneklerin says.

    Ri: Sa dmde i kategorisindeki rneklerin says olmak zere;

    Ginisol = 1-2

    1

    ki

    i sol

    LT=

    ,

    Ginisa = 1-2

    1

    ki

    i sol

    LT=

    ,

    eklinde hesaplanmakta ve her j nitelii iin, eitim verisindeki satr says n olmak

    zere genel Gini indeks deeri ise;

    Ginij = ( )1 sol sol sag sagT Gini T Ginin + forml ile hesaplanmaktadr.

  • 55

    3.2. YAPAY SNR AI MODELLER

    Sinir alar, tek katmanl ya da ok katmanl olarak snflandrlrlar. Katman

    saysn belirlerken, girdi birimi bir katman olarak saylmaz; nk bunlar zerinde

    hibir hesaplama ilemi yaplmaz.

    3.2.1. Tek Katmanl Alglayclar

    Tek katmanl yapay sinir alar giri ve k katmanlarndan oluur. Girdi ve

    kt katmanlarnda birden fazla giri ve k deeri bulunmaktadr. Giri katmanndaki

    her giri deerini k katmanna balayan sinaptik balantlar mevcuttur. Her balant

    bir arlk deerine sahiptir. Ayn zamanda an ktsnn sfr olmasn engelleyen bias

    sapma deeri mevcuttur.

    Tek katmanl YSA rnek snflandrma, tanma, rnek ilikilendirme ve bunun

    gibi dier problemlerin zlmesinde kullanlabilir. rnek snflandrma

    problemlerinde, her giri vektr (rnek, numune) belirli snflara ait olabilir ya da

    olmayabilir. Basit olarak, bir snfa ye olma sorusu gz nnde bulundurulur. k

    birimi iin +1 cevabnn alnmasyla rnein o snfa ye olduu, -1 cevab alnrsa,

    rnein o snfa ye olmad belirlenir. Bu tip durumlarda, her bir snf iin bir k

    birimi vardr. rnek tanmlama, rnek tanma uygulamasmn bir eididir. rneklerin

    ilikili hatrlanmas ise daha farkldr [6].

    Aada ekil 3.5 de tek arlk katmanl YSA iin rnek verilmitir. Bu a ileri

    beslemeli alara birer rnektir.

  • 56

    ekil 3.1. Tek Arlk Katmanl Bir Yapay Sinir A

    Tek katmanl sinir alarnn eitilmesinde nemli yntem vardr:

    Hebb Kural

    Perseptron renme Kural

    Delta Kural

    3.2.1.1. Hebb Kural

    Hebb kural, bir yapay sinir a iin, en eski ve en basit renme kural olarak

    bilinir. Hebb, renmenin, sinaps uzunluklarn (arlklar) deitirerek meydana

    geleceini nermitir. Hebbe gre, eer birbiri ile bal iki nronun her ikisi de ayn

    zamanda aktif ise, bu nronlara uygun arlklarn artrlmas gerekmektedir. Benzer

    olarak, eer her iki nron ayn zamanda pasif ise, arlklarn artrlmas gerekir. Bu

  • 57

    durumda, daha gl bir renme ekli meydana gelir. Gelitirilmi Hebb kural ile tek

    katmanl ileri beslemeli bir sinir ann eitilmesi bir Hebb an anlatr. Hebb kural,

    dier zgl alar eitmek iin de kullanlabilir. Tek katmanl bir yapay sinir anda

    birbiri ile balantl nronlardan bir tanesi giri birimi, bir tanesi de k birimi

    olacaktr (hibir giri birimi birbiri ile balanmad iin, herhangi bir k birimleri de

    birbiri ile bal deildir [48,59].

    3.2.1.2. Perseptron

    Perseptronlar, YSAnn renebilir niteliini tayan ilk modelidir. Hebb

    kuralndan daha yetenekli bir renme kuraldr. Perseptron tekrarl renme

    algoritmasdr ve zmn varl durumunda yaknsama niteliine sahiptir. Bu,

    perseptron modelinin en nemli zelliklerinden biridir.

    Rosenblatt (1962) ve Minsky-Papert (1969, 1988) tarafndan eitli perseptron

    modelleri tanmlanmtr. Orijinal perseptronlar, duyumsal birimler, birletirici birimler

    ve cevap birimleri olmak zere nronlarn durumuna sahiptirler. rnein, bir basit

    perseptron duyumsal ve birletirici birimler iin ikili aktivasyon, cevap birimi iin ise

    +1, 0, veya -1 deerlerini reten aktivasyon uygulayabilir.

    Snflandrma problemlerinde eik deerli aktivasyon fonksiyonu kullanlr:

    1, _( _ ) 0, _

    1, _

    y in isef y in y in ise

    y in ise

    qq q

    q

    - < -= - > (3.2)

    kt biriminin aktivasyonu y = f(y_in) eklinde hesaplamr.

    Birletirici birimden cevap birimine giden balantlarn arlklar perseptron

    renme kural ile ayarlamr. Her eitim girii iin, sinir a, k biriminin cevabn

  • 58

    hesaplar. Daha sonra sinir a, bu rnek iin k deeri ile hedeflenen k arasndaki

    fark karlatrarak bir hata oluup olumadn tespit eder. Yapay sinir a,

    hesaplanm k deeri 0 ve hedef deeri -1 olan rnek iin hatay ayrt edemez,

    buna kart olarak hesaplanm k deeri +1 ve hedef deeri -1 olan rnek iin

    hatay ayrt edebilir. Bu durumlarda, hedef verinin iareti ynnde arlklarn iareti

    deitirilmelidir. Bununla birlikte k birimine 0 olmayan sinyaller gnderen

    balantlANN arlklar ayarlanmaldr. Eer belirli bir eitim giri rneinde hata

    oluuyorsa, arlklar

    ( ) ( )i i iw yeni w eski txa= + (3.3)

    formlne gre deitirilmelidir.

    Burada hedef deeri t ya +l ya da -ldir ve a renme oran katsaysdr. Eer

    hata olumadYSA arlklar deitirilmemelidir. Eitim ilemi hata olumayncaya

    kadar devam etmelidir. Perseptron renme kural yaknsama teoremine gre, eer ada

    tm eitim rnekleri iin uygun arlklarn varlna izin verilirse, bu arlklar, eitim

    srecinde btn eitim rnekleri iin elde edilebilir. Bu kuraln amac, an tarn olarak

    doru cevap veremedii eitim rnekleri iin arlklar ayarlamaktr. Ayrca, eitim

    sonunda bu a snrsz saydaki eitim admlar iin arlklarn deerlerini bulmaldr

    [4,7,50].

    3.2.1.2.1. Perseptron Algoritmas

    ekil 3.6de perseptronun mimarisi gsterilmitir. Burada X1 ,..., Xn girdi

    birimleri, Y kt birimi ve 1 sapma sinyalidir. b sapma arl, wi (i = 1,...,n)

    arlklardr.

  • 59

    ekil 3.2. Basit Bir Perseptron Mimarisi

    Snflandrma problemlerinde, sinir ann grevi tm giri rneklerinin belirli

    bir snfa ait olup olmamasn belirlemektir. Snfa ait olma kn +1 deerine, ait

    olmama ise kn -1 deerine uygun olmasyla belirlenir. Snflandrma ilemi

    yaplabilmesi iin a, tekrarl bir teknik ile eitilir. Girdi ve hedefler ikili ve ya iki

    kutuplu olabilir. eik deeri tm birimler iin deimezdir. Sapma ve eik deerinin

    her ikisinin ayn zamanda kullanlmasna ihtiya duyulmaktadr. Bu ilemin algoritmas

    aada verilmitir. Bu algoritma, arlklarn balang deerlerine ve renme oranna

    tam olarak duyarl deildir [6].

    Adm 0 Arlklar ve sapmalara balang deerleri ata.

    (Arlklar ve sapma deeri kolaylk iin 0 olarak ahnabilir.)

    renme oran olan (0 < < l)y ayarla. (kolaylk iin, a, le eitlenebilir.)

    Adm 1 Durma koulu yanl iken , adm 2-6' y uygula.

    Adm 2 Her bir s:t renme ifti iin, 3-5 admlarn uygula.

    Adm 3 Giri birimlerinin aktivasyonlANN ayarla. xi = si i = 1, . . . , n

  • 60

    Adm 4 Her kt birimi iin aktivasyonlar hesapla.

    _ . 1,...., :j j i iji

    y in b x w j m= + =

    1, _( _ ) 0, _

    1, _

    y in isef y in y in ise

    y in ise

    qq q

    q

    - < -= - > (3.4)

    Adm 5 Arlklar ve sapmalan ayarla.

    ,j jeger t y ise (3.5)(3.4)

    ( ) ( )j j jb yeni b eski t= +

    ( ) ( ) .ij ij j iw yeni w eski t x= +

    ,j jeger t y ise

    ( ) ( )j jb yeni b eski=

    ( ) ( ).ij ijw yeni w eski=

    (3.6)Adm 6 Durma koulu:

    Eer adm 2de hi bir arlk deimezse dur; aksi duaimda devam et.

    Algoritmada kt birimlerinin says m = 1 olabilir. rnein, mantksal fonksiyonlar

    gzden geirirken kt biriminin saysnn bir olduu kabul edilir. Eitimden sonra, a

    her bir eitim vektrn doru ekilde snflandrr.

    Snflandrma ile ilgili perseptron eitim algoritmasnda, ayrma dorusu yerine,

    pozitif cevaplar blgesini sfr cevaplar blgesinden ayran w1x1 +w2x2 +b > dorusu

    ve negatif cevaplar blgesini sfr cevaplar blgesinden ayran w1x1 +w2x2 +b

  • 61

    3.2.1.2.2. Delta

    Delta kural, Widrow ve Hoff (1960) tarafndan ADALINE iin ortaya atlm

    olan iteratif bir renme srecidir. Delta kuralnda, tm girdi numuneleri iin kt ve

    hedef farklar karelerinin toplamnn, baka bir ifadeyle, toplam hatann kltlmesine

    hedeflenmitir. Uygun algoritmalarda her numune iin gradient vektrnn ters

    ynnde arlklarn gncellenmesi yaplr. Bu durumda delta kural, nron

    balantlarnn arlklarn, a girii (y_in) ve an hedef k (t) arasndaki fark en

    aza indirgeyecek ekilde deitirir. Ama, tm eitim numunelerinin hatalarn en aza

    indirgemektir. Arlk dzeltmeleri, ok saydaki eitim numunesi ile beraber

    biriktirilebilir ve bu yn gncelletirilmesi olarak adlandrlr [6].

    3.2.2. ok Katmanl Alglayclar

    Tek katmanl alar ayrlamayan problemlerin zmnde baarsz

    olmaktadrlar. Bunun iinde bilim adamlar ok katmanl YSA modellerini

    incelemilerdir. Burada nemli aamalardan biri bu tip alar iin akll bir eitim

    algoritmasn gelitirmekti.