FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA · 2011-11-21 · t.c. marmara ÜnĐversĐtesĐ sosyal...

T.C. MARMARA ÜNĐVERSĐTESĐ

SOSYAL BĐLĐMLER ENSTĐTÜSÜ ĐŞLETME ANABĐLĐM DALI

SAYISAL YÖNTEMLER BĐLĐM DALI

FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA

Yüksek Lisans Tezi

MURAT YAZICI

Đstanbul, 2011

T.C. MARMARA ÜNĐVERSĐTESĐ

SOSYAL BĐLĐMLER ENSTĐTÜSÜ ĐŞLETME ANABĐLĐM DALI

SAYISAL YÖNTEMLER BĐLĐM DALI


Yüksek Lisans Tezi

MURAT YAZICI

Danışman: Prof. Dr. Đsmail Hakkı ARMUTLULU

Đstanbul, 2011

i

GENEL BĐLGĐLER

Đsim ve Soyadı : Murat YAZICI

Anabilim Dalı : Đşletme

Programı : Sayısal Yöntemler

Tez Danışmanı : Prof. Dr. Đsmail Hakkı ARMUTLULU

Tez Türü ve Tarihi: Yüksek Lisans – Kasım 2011

Anahtar Kelimeler: Fuzzy Robust Regresyon, Fuzzy Regresyon, Robust Regresyon,

Çoklu Doğrusal Regresyon, Otomobil, Otomobil Beğeni Fonksiyonu

ÖZET


Regresyon analizinde veri setini analiz etmek oldukça önemlidir. Çünkü tek bir

gözlem bile regresyon modelindeki parametre kestirimleri üzerinde büyük bir etkiye

sahip olabilir. Aykırı ya da uç değerlerin veriden çıkartılması zamanında önerilse de bu

regresyon denklemini tamamen değiştirebilir. Bu nedenle, veri setinde aykırı ya da uç

değer olması durumunda non-parametrik yöntemlerden olan robust yöntemler

önerilmiştir. Robust yöntemlerin aykırı ya da uç değer olması durumunda klasik

regresyona göre daha iyi sonuçlar verdiği görülmektedir.

Bu çalışmada EKK yöntemine dayanan Klasik Regresyon Analizi, Robust

Regresyon Analizi, Fuzzy Regresyon Analizi ve Fuzzy Robust Regresyon Analizi

incelenmiştir. Sonrasında 45 otomobil markasının teknik verileriyle yukarıda bahsi

geçen her bir analiz uygulanmış ve sonuçlar karşılaştırılmıştır.

ii

GENERAL KNOWLEDGE

Name and Surname : Murat YAZICI

Field : Business Administration

Programme : Quantitative Methods

Supervisor : Đsmail Hakkı ARMUTLULU

Degree Awarded and Date: Master – November 2011

Keywords : Fuzzy Robust Regression, Fuzzy Regression,

Robust Regression, Multiple Linear Regression,

Automobile, Automobile Rating Function

ABSTRACT

FUZZY ROBUST REGRESSION WITH AN APPLICATION

In regression analysis, data analysis is very important. Because, even one

observation may be large effect over parameters estimates in regression model. Outliers

or extreme values are removed from the data is recommended at the time of this

regression equation can change completely. Therefore, the data set to be contrary to the

case of extreme or outlier value, robust methods which are non-parametric methods are

proposed. Robust methods are given beter results than classical regression if data set

includes extreme or outlier values.

In this study, based on the classical method of EKK Regression Analysis,

Robust Regression Analysis, Fuzzy Regression Analysis and Fuzzy Robust Regression

Analysis were examined. After, with technical data of 45 automobile brands, each

analysis of above mentioned were applied and results were compared.

iii

ĐÇĐNDEKĐLER

ÖZET………………………………………………………………………………… i

ABSTRACT………………………………………………………………………….. ii

ĐÇĐNDEKĐLER……………………………………………………………………… iii

TABLO DĐZĐNĐ……………………………………………………………………... vii

ŞEKĐL DĐZĐNĐ………………………………………………………………………. viii

1. GĐRĐŞ……………………………………………………………………………… 1

2. ÇOKLU DOĞRUSAL REGRESYON, ROBUST REGRESYON, FUZZY

REGRESYON VE FUZZY ROBUST REGRESYON………………...………….. 3

2.1. Çoklu Doğrusal Regresyon Analizi………………………….......…..…………... 3

2.1.1. Çoklu Doğrusal Regresyon Denklemi ve Varsayımı…..……………….. 3

2.1.2. Çoklu Doğrusal Regresyonda En Küçük Kareler (EKK) Kestirimi……. 4

2.1.3. Anlamlılık Testleri……………………………………….….………….. 5

2.1.3.1. Tümel-F Testi (Varyans Çözümlemesi)…………….………… 6

2.1.3.2. T-Testi………………….………………….………………..... 7

2.1.4. EKK Kestiricisi’nin Etkin Olmadığı Durumlar………………………... 8

2.2. Robust Regresyon Analizi………………….……………………………………. 8

2.2.1. Robust Yöntemlerin Hedefleri………………………………………..… 9

2.2.2. Robust Kestiriciler……………………..………………………………. 10

iv

2.2.2.1. L Kestiriciler………………………………….……………… 10

2.2.2.1.1. 1L Regresyonu:

LAV (Least Absolute Values) Kestiricisi….............. 10

2.2.2.1.2. LMS (Least Median of Squares) Kestiricisi………... 12

2.2.2.1.3. LMS’ye Dayalı Yeniden Ağırlıklandırılmış EKK

(RLS) Kestiricisi……………….…………………… 13

2.2.2.1.4. LTS (Least Trimmed Squares) Kestiricisi……...….. 13

2.3. Fuzzy Regresyon Analizi…………………………………….………………….. 14

2.3.1. Alt ve Üst Regresyon Doğrularının Hesaplanması……………………. 14

2.3.2. Aralık Regresyonu…………………………..………………….……… 17

2.3.3. Doğrusal Programlama Modelleri……………………..……………… 19

2.3.3.1. Tanaka Modeli……………………….………..…………….. 19

2.3.3.2. Sakawa & Yano Modeli…………………….………..……… 25

2.3.3.3. Peters Modeli………………………..……….……………… 25

2.3.4. Regresyon Katsayılarının Bulandırılması Yöntemi…………………..... 27

2.3.5. Fuzzy En Küçük Kareler (F-EKK) Yöntemi…………………....……… 29

2.3.6. Maksimum Uyum Kriteri ile Fuzzy Regresyon Analizi……………..….. 32

2.3.7. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı…………………… 34

v

2.4. Fuzzy Robust Regresyon Analizi……..…………………………………………. 36

2.4.1. M-Kestiricisi’ne Dayanan

Fuzzy Robust Regresyon Analizi…………………………...………….. 36

2.4.2. Girdi Değişkenlerinin Fuzzy (Bulanık) Olması Durumunda

Robust Regresyon Analizi……………………………………...………. 40

2.4.3. Şanlı K. ve Apaydın A.’nın Önerdiği Algoritma……………………..… 42

3. OTOMOBĐL BEĞENĐ DEĞERĐ FONKSĐYONUNUN BELĐRLENMESĐNDE

DÖRT TEKNĐĞĐN KARŞILAŞTIRILMASI……………………………………... 44

3.1. Regresyon Analizi………………………………………………………………... 47

3.2. Robust Regresyon Analizi………………………………………………………... 48

3.2.1. LMS (Least Median of Squares) Kestiricisi Yöntemi ve RLS…………... 48

3.2.2. LTS (Least Trimmed Squares) Kestiricisi Yöntemi ve RLS…………….. 52

3.3. Fuzzy Regresyon Analizi………………………………………………………… 56

3.3.1. Tanaka Modeli Uygulaması……………………………………………. 56

3.3.2. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı Uygulaması………. 60

3.4. Fuzzy Robust Regresyon Analizi………………………………………………… 62

3.5. Karşılaştırma……………………………………………………………………... 68

vi

4. SONUÇ ve BULGULAR…………………………………………………………. 69

EKLER……………………………………………………………………………….. 72

EK 1. ANALĐZLERDE KULLANILAN OTOMOBĐL MARKALARI…………. 72

KAYNAKLAR….…………………………………………………………………… 73

vii

TABLO DĐZĐNĐ

Tablo 1: Girdi Değişken Verileri ve Hedef Çıktılar……………………..…………… 46

Tablo 2: Girdi Değişken Verileri, Hedef Çıktılar ve LMS’den Elde Edilen Y*, e…... 50

Tablo 3: Girdi Değişken Verileri, Hedef Çıktılar ve LTS’den Elde Edilen Y*, e…… 53

Tablo 4: Kesin ve Fuzzy Y için ( , )j jm s ’ler ……………………………………… 56

Tablo 5: Kesin ve Fuzzy Y Đçin Tahmini Değerler (Y*), FR1 FR2 Đstatistikleri…...... 57

Tablo 6: Kestirilen ja , b ve d ………………………………………………………. 60

Tablo 7: m , *m ve s , *s Değerleri………………………………………………… 61

Tablo 8: Kesin Y için 1 2 3( , , )j j ja a a ’ler………………………………………………. 62

Tablo 9: 2 3 5 6, , ,A A A A Analizden Çıkartıldığında Kesin Y için 1 2 3( , , )j j ja a a ’ler…… 63

Tablo 10: Gözlenen Y ve Tahmin Edilen Y* Değerleri….....………………………… 65

Tablo 11: Dört Tekniğin Karşılaştırması……………………………………………... 68

viii

ŞEKĐL DĐZĐNĐ

Şekil 2.1. Regresyon Doğrusu ile Aykırı ve/veya Uç değer…………………………. 8

Şekil 2.2. LY , UY ve hY α= ’nın Gösterimi…………………………………………… 16

Şekil 2.3. Kesin (Crisp) X ve Kesin (Crisp) Y için Aralık Regresyon Modeli………. 17

Şekil 2.4. Kesin (Crisp) X ve Bulanık Y için Aralık Regresyon Modeli…………….. 17

Şekil 2.5. ja Katsayılarının Üyelik Fonksiyonu……………………………………... 22

Şekil 2.6. iY Değerlerinin Üyelik Fonksiyonu……………………………………….. 23

Şekil 2.7. Tanaka Modelinde Tahminlerin Görünümü……………………………….. 24

Şekil 2.8. Sakawa & Yano Modelinde Tahminlerin Görünümü……………………… 25

Şekil 2.9. Peters Modelinde Tahminlerin Görünümü………………………………… 26

Şekil 2.10. γ Uyum Ölçüsü…………………………………………………………... 33

Şekil 2.11. γ =0 Uyum Ölçüsü , γ =1 Uyum Ölçüsü..………………………………... 33

Şekil 2.12. FLR Model………………………………………………………………... 39

Şekil 2.13. FLR Model ile Aykırı Değer…..…………………………………………. 39

Şekil 3.1. Tahmin Edilen Y*’ların Görünümü……………………………………….. 66

Şekil 3.2. 3 8 43, ,m m my y y ile Birlikte Tahmin Edilen Y*’ların Görünümü…………….. 67

1

1. GĐRĐŞ

Regresyon Analizi en basit anlamda bir veya birden fazla bağımsız değişkenle

bir bağımlı değişkeni açıklama esasına dayanmaktadır. Regresyon terimi ilk olarak 19.

yüzyılda Đngiliz istatistikçi Francis Galton tarafından bir biyolojik inceleme sırasında

ortaya atılmıştır. Galton, baba ve annenin boyu ile çocukların boyu arasındaki bağlantıyı

araştırmak istemiştir. Sonrasında Udny Yule, Karl Pearson yöntemi çeşitli istatistiksel

alanlarda uygulamış ve geliştirmişlerdir. 1

Veri setinde aykırı ya da uç değer olması En küçük Kareler (EKK) Yöntemi ile

kestirilen regresyon parametrelerinin etkinliğini düşürmektedir. Gerçek hayat

verilerinde özellikle sosyal verilerde aykırı ya da uç değerlerle karşılaşıldığından

regresyon parametrelerini daha iyi kestirebilecek yeni tekniklere ihtiyaç duyulmuş ve

robust kestirim yöntemleri geliştirilmiştir. Đlk kez robust kelimesi 1963 yılında Box

tarafından kullanılmış ve EKK kestiricisindeki özellikle normallik varsayımına duyarsız

yaklaşımlar olarak tanımlanmıştır.

1960’lı yıllarda Zadeh’in geliştirdiği Bulanık (Fuzzy) Küme Teorisi yaklaşımı,

nitel değişkenleri sayısal olarak değerlendirme imkanı sunmuştur. Daha sonra 1980’li

yıllarda Tanaka, Bulanık Küme Teorisi’nden yararlanarak Bulanık Doğrusal Regresyon

Analizi Yöntemi’ni geliştirmiştir. Tanaka’nın geliştirdiği Bulanık Doğrusal Regresyon

Analizi yayılımların toplamını minimum yapma esasına dayanmaktadır. Sonrasında

Sakawa ve Yano, Tanka’nın modelini esneterek, gözlem değerlerinin tamamının belirli

aralığa düşmesi yerine, sadece bir kısmının (en az h kadarının) düşmesini yeterli

görmüşlerdir. Sonrasında ise Georg Peters, gerçek verilerle Bulanık Doğrusal

Regresyon Analizi üzerinde çalışırken yeni bir model geliştirmiştir. 2

1 Pearson K., Yule U., Blanchard N., Lee A. "The Law of Ancestral Heredity", Biometrika, 1903

2 Peters G., “Fuzzy Linear Regression with Fuzzy Đntervals”, Fuzzy Sets and

Systems,1994

2

Fuzzy Regresyon Analizi’nde veri setinde aykırı ya da uç değerler

bulunmasında yayılım değerleri büyümektedir. Her ne kadar bağımlı değişken yüksek

yayılımla iyi bir şekilde açıklanabilse de yayılımın düşük olması tercih edilmektedir.

Yayılımın yüksek olduğu ve düzensiz verilerin veri setinde bulunması durumunda

robust yöntemlere ihtiyaç duyulmuştur. Günümüzde Fuzzy Robust Regresyon Analizi

üzerinde çalışmalar devam etmekte, veri setini iyi ifade edebilecek çeşitli robust

yöntemleri içeren algoritmalar geliştirilmektedir.

Đkinci bölümde, Çoklu Doğrusal Regresyon Analizi, Robust Regresyon

Analizi, Fuzzy Regresyon Analizi ve Fuzzy Robust Regresyon Analizi açıklanmıştır.

Açıklanan analizlerde üç tip fuzzy sayısı gösterimi kullanılmıştır. Bu gösterimlerden

ilki, 1 2 3( , , )A a a a=∼

’dir. Burada 2a merkez değerini, 1a sol değeri, 3a ise sağ değeri

ifade etmek üzere, 1 2 3( , , )A a a a=∼

üçgen fuzzy sayısıdır. Gösterimlerden ikincisi,

( , )A m s=∼

’dir. Burada m merkez değerini, s ise yayılım değerini ifade etmek üzere,

( , )A m s=∼

simetrik üçgen fuzzy sayısıdır. Gösterimlerden üçüncüsü ise, ( , , )i i i iX x ζ ζ=

ve ( , , )i i i iY y η η= ’dir. Burada ix merkez değerini, iζ sol yayılım değerini, iζ ise sağ

yayılım değerini ifade etmek üzere, ( , , )i i i iX x ζ ζ= üçgen fuzzy sayısı; iy merkez

değerini, iη sol yayılım değerini, iη ise sağ yayılım değerini ifade etmek üzere

( , , )i i i iY y η η= üçgen fuzzy sayısıdır.

Üçüncü bölümde 45 otomobil markasına ait teknik verilerle açıklanan her bir

analizle otomobil beğeni değeri fonksiyonu oluşturulmaya çalışılmıştır.

Dördüncü bölümde ise, sonuç ve bulgulara yer verilmiştir.

3

2. ÇOKLU DOĞRUSAL REGRESYON, ROBUST REGRESYON,

FUZZY REGRESYON VE FUZZY ROBUST REGRESYON

2.1. Çoklu Doğrusal Regresyon Analizi

Bağımsız değişken sayısının birden fazla olduğu durumlarda uygulanmak

istenilen regresyon analizi çoklu regresyon adını alır. Amaç, 1 2( , , , )kY f X X X= ⋯

denklemini araştırmaktır. Doğrusal bir ilişki söz konusu olduğunda araştırılmak

istenilen regresyon denklemi, 3

0 1 1 2 2 k kY X X Xβ β β β ε= + + + + +⋯ (2.1)

şeklinde olacaktır.

2.1.1. Çoklu Doğrusal Regresyon Denklemi ve Varsayımı

Çoklu doğrusal regresyon denklemi, bir i ’inci gözlem için,

0 1 1 2 2 ... , 1, 2,...,i i i k ik iY X X X i nβ β β β ε= + + + + + = (2.2)

şeklindedir. Bu eşitlik örneklemden elde edilen istatistiklerle,

0 1 1 2 2 ... , 1, 2,...,i i i k ik iY b b X b X b X e i n∧

= + + + + + = (2.3)

şeklini alacaktır.

(2.3) denkleminin iyi bir kestirimi için şu varsayımlar sağlanmalıdır. 4

(1) X matrisi ( 1)k + ranklı olmalıdır. Yani denklemler doğrusal bağımsız

olmalıdır.

3 Erar A., “Bağlanım (Regreyon) Çözümlemesi, Ders Notları…”, MSGSÜ, Đstatistik,

Eylül 2006, s:73

4 Erar A., s:77

4

(2) ( ) 0, i=1,2,...,n için.iE ε = (2.4)

(3) 2( ) , i=1,2,...,n için.iV ε σ= (2.5)

(4) ( , ) 0 i jCov ε ε = (2.6)

jX ’lerin raslantı değişkeni oldukları durumlarda,

(5) ( , ) 0, i=1,2,...,n için.i iCov x ε = (2.7)

Đstatistiksel çıkarsamalarda,

(6) 2(0, )Nε σ∼ . (2.8)

2.1.2. Çoklu Doğrusal Regresyonda En Küçük Kareler

(EKK) Kestirimi

En küçük kareler yöntemi ile amaç,

2 2( )i iiy y e∧

− =∑ ∑ (2.9)

eşitliğini en küçükleyen regresyon katsayılarının kestirimini bulmaktır. β ’nın EKK ile

kestirimi şu şekilde olacaktır (altı çizili ifadeler ifadenin vektör olduğu anlamındadır);

'2 ' '

' ' ' '' '

( ) ( ) ( ) ( )

ie e e Y Y Y Y Y X Y X

Y Y Y X X Y X X

β β

β β β β

∧ ∧ ∧ ∧

∧ ∧∧ ∧

= = − − = − −

= − − +

∑ (2.10)

' ' 'Y X X Yβ β∧∧

= olduğundan,

' ' '' '2Y Y X Y X Xβ β β∧ ∧ ∧

= − + (2.11)

eşitliği β∧

’ya göre türevi alınıp sıfıra eşitlenirse,

5

' ' '' '

' '( 2 )

2 2 0Y Y X Y X X

X Y X Xβ β β

ββ

∧ ∧ ∧∧

∧

∂ − += − + =

∂ (2.12)

olacaktır. Buradan,

'X X β∧

= 'X Y (2.13)

β∧

= ' 1 '( )X X X Y− (2.14)

bulunur. 5 Burada,

0

1

k

b

b

b

β∧

=

⋮

1 2

21 1 2 1

' 22 2

2k

...

...

...

(Simetrik)

k

k

k

n X X X

X X X X X

X X X X X

X

=

∑ ∑ ∑∑ ∑ ∑

∑ ∑

∑⋮

1

'2

k

Y

X Y

X Y X Y

X Y

=

∑∑∑

∑⋮

‘dır.

2.1.3. Anlamlılık Testleri

Çoklu doğrusal regresyonda genelde iki tür test kullanılır.

1. Tümel-F testi (varyans çözümlemesi)

2. T-testi

5 Erar A., s:79

6

2.1.3.1. Tümel-F Testi (Varyans Çözümlemesi)

Tümel-F testi (varyans çözümlemesi) şu amaçlarla yapılır: 6

1) Bir bağımlı değişkenin k sayıda bağımsız değişkence birlikte açıklanıp

açıklanmadığının incelenmesi: Değişkenler arasında doğrusal bir bağıntının

kurulabilmesi varyans çözümlemesi ile araştırılabilir.

2) Denklemlerin karşılaştırılması: Aynı konu ile ilgili değişik bağlanım

denklemleri F-testi yardımıyla karşılaştırılarak hangi denklemin kullanımının daha

uygun olduğuna karar verilebilir.

Tümel-F testi,

0 1 2: ... 0kH β β β= = = = (2.15)

hipotezinin,

1 : En az bir sıfırdan farklıdır.jH β (2.16)

hipotezine karşı test edilmesidir. Test sonucunda 0H kabul edilirse, bağımlı ve

bağımsız değişkenler arasında doğrusal bir bağıntıdan söz edilemeyeceği α yanılgısı ile

belirtilebilir. Bu demektir ki tüm jX ’lerin,

0y β ε= + (2.17)

denklemine katkısı anlamlı değildir. 0H reddedilir ise bağımlı ve bağımsız değişkenler

arasında 1-α güvenirliği ile doğrusal bir bağıntı kurulabilir; k sayıda değişkenin 0β ’lı

modele birlikte katkısı anlamlıdır. Bununla birlikte, 1H ’in kabul edilmesi tüm jβ ’lerin

sıfırdan farklı oluşunu göstermez. Bu, bazı jβ ’lerin ya da en az bir jβ ’nin anlamlı

6 Erar A., s:86

7

olduğunu gösterir. Bu durumda, regresyon analizi daha ileri aşamalarla

sürdürülecektir. 7

/

/ ( 1)

RKT k RKO RegresyonKarelerOrtalamasıF

AKT n k AKO ArtıkKarelerOrtalaması= = =

− − (2.18)

2' 'BKT X Y n yβ∧

= − (2.19)

' ''AKT Y Y X Yβ∧

= − (2.20)

2.1.3.2. T-Testi

0 1 2: ... 0kH β β β= = = = hipotezi reddedildiğinde, hangi jβ ’lerin sıfırdan

farklı olduğu ya da tüm jβ ’lerin sıfırdan farklı olup olmadıkları, 0 : 0jH β =

hipotezinin 1 : 0jH β ≠ hipotezine karşı testi ile incelenir. Regresyon katsayılarının bu

testi şu amaçlarla yapılır: 8

1) Denklemdeki her bir değişkenin, öteki değişkenlerin etkisi arıtıldıktan sonra

bağımlı değişkeni açıklamadaki önemini araştırmak.

2) Değişkenlerin, bağımlı değişkeni açıklamadaki önemlilik derecelerini

saptamak. t değerleri büyükten küçüğe doğru sıralandığında hangi jX ’nin daha etkin

olduğu görülebilir. Ancak bu sıralama, bağımsız değişkenlerin birbiriyle ilişkili

olmamaları koşulu ile geçerlidir.

7 Đnal H. C., Günay S., “ Olasılık ve Matematiksel Đstatistik”, Hacettepe Üniversitesi

Fen Fakültesi Yayınları, Beşinci Baskı, Ders Kitapları Dizini: 16, 2002, s:86

8 ErarA., s:88

8

3) Model kurmak.

Arka satfadaki 0H ’ın testi,

j

j

b

bt

S= (2.21)

değerinin bulunması ile yapılır. Bu değer 1n k− − serbestlik dereceli tα ile

karşılaştırılır. Hesap Tablot t> durumunda 0H reddedilir.

2.1.4. EKK Kestiricisi’nin Etkin Olmadığı Durumlar

Aşağıdaki üç şekilde görüldüğü üzere veri setinde bu gibi aykırı ya da uç değer

bulunması durumunda EKK Kestiricisi iyi sonuç vermemekte, veri setini iyi ifade

edecek kestirimlerde bulunamamaktadır.

Şekil 2.1. Regresyon Doğrusu ile Aykırı ve/veya Uç değer

2.2. Robust Regresyon Analizi

Veri setinde aykırı değerlerin bulunması EKK kestiricisinin etkinliğini

düşürmektedir. Diğer bir ifade ile EKK kestiricisi, veri setini açıklamaya çalışan

regresyon denklemi için iyi bir kestirici olmamaktadır. Uygulamada veri setlerinde

aykırı değerlerle karşılaşıldığından, veri setini daha iyi ifade edebilecek; regresyon

katsayılarını daha iyi kestirebilecek kestiricilere ihtiyaç duyulmuştur. Öte yandan EKK

9

Kestiricisi’nin uygulanabilmesi için gerekli olan varsayımların karşılanmaması

durumunda yeni kestiricilere ihtiyaç duyulmuştur.

Robust kestiriciler bu ihtiyaçları karşılamak için geliştirilmiştir. Robust

kestiricilerin bazıları, LAV, LMS, LTS kestiricileri’dir. Bu bölümde bu kestiriciler

incelenecektir.

Yukarıda bahsedildiği üzere en küçük kareler regresyonu birkaç problem teşkil

etmektedir. Veri setinde tek bir aykırı veya uç değerin olması durumunda en küçük

kareler regresyonu iyi sonuç vermemektedir. En küçük kareler regresyonu bu değerlere

uygulandığında elde edilen tahmini Y değeri (^

Y ) normal dağılıma uysa bile varyansın

sıfır olduğunu ileri süren 0 : 0H σ = hipotezi aykırı/uç değer nedeni ile kabul

edilemeyebilir. Normal olmayan durumlarda ise en küçük kareler regresyonu ile eğim

değerini hesaplamak yanlış olacaktır. Her koşulda iyi sonuç verebilecek tek bir

regresyon kestirim yöntemi henüz keşfedilmemiştir. Bunun için koşullar bazında uygun

olan kestirim yöntemleri seçilmektedir.

2.2.1. Robust Yöntemlerin Hedefleri

Robust kestiricilere değinmeden önce robust regresyon kestiricilerini cazip

kılan özelliklerden bahsedersek;

1) Temel varsayımlar sağlanmadığında EKK’dan daha iyi bir performans

göstermesi,

2) Temel varsayımların sağlandığı durumlarda ise hemen hemen EKK kadar

başarı sağlaması,

3) Aşırı derecede hesaplama ve anlaşılma zorluğuna sahip olmamasının

hedeflendiği söylenebilir.

10

2.2.2. Robust Kestiriciler

2.2.2.1. L Kestirciler

Sıralı istatistiklerin lineer kombinasyonlarını temel alan sağlam kestiriciler L

kestiriciler olarak isimlendirilmektedir. L kestiriciler matematiksel olarak;

(1) (2) ( ), ,..., nχ χ χ n büyüklüğündeki örneklemin sıralı istatistikleri ve 1 2 ... na a a≤ ≤ ≤

gerçel sayılar (0 1 i=1,2,...,n)ia≤ ≤ olmak üzere; 9

1

1n

ii

a=

=∑ koşuluyla L kestiricisi, (2.22)

1

n

i ii

T a x=

=∑ eşitliği ile tanımlanır. (2.23)

Örneğin n büyüklüğündeki bir örneklemin ortalamasının ağırlığının 1/n olduğu

durum bir L kestiricisidir.

L kestiricilerinin hesaplanması kolay olmasına rağmen aykırı değerlere ağırlık

vererek sağlamlıklarından ya da aykırı olmayan değerlere daha küçük ağırlık vererek

etkinliklerinden ödün vermelerine neden olmaktadır. 10

2.2.2.1.1. 1L Regresyonu :LAV (Least Absolute Values) Kestiricisi

Bu yöntem artıkların mutlak değerlerinin toplamlarını minimum yapma esasına

dayanmaktadır. 1 1 2 2( , ), ( , ), ... ,( , )n nX Y X Y X Y gözlem çiftleri için ^

0 1Y b b X= +

denklemi oluşturulmak istensin.

9 Vural A., “Aykırı Değerlerin Regresyon Modellerine Etkileri ve Sağlam Kestiriciler”,

Yüksek Lisans Tezi, Marmara Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2007,

s:29

10 Hoaglin D. C., Mosteller F., Tukey J. W.,”Understanding Robust and Explonatory

Data Analysis”, New York: John Wiley & Sons, 1983, s:339

11

^

1 1 1 1 1 1 0

^

2 2 2 2 1 2 0

^

1 0

,

,

n n n n n

e Y Y Y b X b

e Y Y Y b X b

e Y Y Y b X b

= − = − −

= − = − −

= − = − −

⋮

(2.24)

olsun. Burada her e değeri görüldüğü üzere, ölçülen Y değeri ile tahmini Y değeri (^

Y )

arasındaki farkı temsil etmektedir. Amaç fonksiyonumuz şu şekilde tanımlanabilir:

( )n

1 2i=1

min min ...i ne e e e= + + +∑ (2.25)

Burada her bir ie değerini 0’a eşitleyerek n tane 0b ve 1b bilinmeyenli lineer

denklem sistemi elde edilir. Lineer denklem sisteminin çözülmesi ile 0b ve 1b değerleri

kestirilmiş olunur. Bu yöntem 1L Regresyonu veya diğer adıyla LAV (Least Absolute

Values) Kestiricisi olarak adlandırılmaktadır.

1L Regresyonu’nu iyi bir kestirici kılan özelliği, ölçülen Y değerleri arasındaki

aykırı değerlerin regresyon denklemi üzerindeki etkisini azaltmasıdır. X değerleri ile

en küçük kareler kestiricisinin, Ortalama Y ’yi bulmayı amaçlamasının aksine, 1L

Regresyonu Medyan Y ’yi bulmayı amaçlamaktadır. Fakat 1L Regresyonu X değerleri

arasındaki aykırı ya da uç değerlere karşı etkin değildir. 1L Regresyonu’nun ya da diğer

adıyla LAV Kestiricisi’nin diğer robust regresyon kestiricilere göre daha verimli olup

olmadığı halen daha tartışılmaktadır. 11

11 Andersen R., “Modern Methods for Robust Regression”, SAGE Publications, 2008,

s:49

12

2.2.2.1.2. LMS (Least Median of Squares) Kestiricisi

Hata karelerinin medyanını minimum yapmayı amaçlayan bu yöntemde amaç

fonksiyonu,

2 20 1 1 2 2min( ( )) min( ( ( ... ) )i i i i i i k kimed w e med w y b b x b x b x= − − − − − (2.26)

biçiminde tanımlanır. Burada ie , i ’nci gözlem hatasıdır. Bu yöntemde i ’inci gözlemin

ağırlığı,

1 / 2.5

0 / 2.5

i

i

i

e

w

e

σ

σ

∧

∧

≤

= >

(2.27)

biçiminde hesaplanır.

[ ]2.5,2.5− aralığının dışına düşen standartlaştırılmış hata değerleri, potansiyel

uç ya da aykırı değer olarak düşünülmektedir. Ağırlık fonksiyonunda ( iw ) bu aralığın

dışındaki standartlaştırılmış hata değerlerine 0 değeri, aralık içindeki standartlaştırılmış

hata değerlerine ise 1 değeri atanmaktadır.

2.5 değeri keyfi bir değerdir fakat normal durumda çok az artıklar 2.5σ∧

‘dan

daha büyük olabileceğinden oldukça makul bir değerdir. 12

2.27 numaralı ifadedeki σ∧

,

251.4826 1 ( )imed e

n pσ∧ = + −

(2.28)

12 Rousseeuw P. J., Leroy A. M., “Robust Regression and Outlier Detection”, Jonh

Wiley & Sons, 2003, s:17

13

olarak tanımlanır. Burada n toplam gözlem sayısını, p değişken sayısını ifade

etmektedir. 1.4826 ve 5 sayısı, LMS Kestiricisi için, hata karenin meydanının dağılımını

Normal Dağılım’a yaklaştırmak adına Rousseeuw ve Leroy tarafından önerilmiştir.

2.2.2.1.3. LMS’ye Dayalı Yeniden Ağırlıklandırılmış EKK

(RLS) Kestiricisi

RLS yönteminde ağırlıklandırılmış hata kareler toplamı minimum yapılmaya

çalışılır. Amaç fonksiyonu;

2 20 1 1 2 2min min ( ... )i i i i i i k ki

i i

w e w y b b x b x b x= − − − − −∑ ∑ (2.29)

biçiminde tanımlanır. RLS yönteminde ağırlıklar, 2.27 numaralı ifadedeki fonksiyonla

hesaplanır. 2.27 numaralı ifadedeki σ∧

değeri, 2.28 numaralı eşitlik yardımıyla

hesaplanır.

2.2.2.1.4. LTS (Least Trimmed Squares) Kestiricisi

LTS kestiricisi yöntemi 1984 yılında Rousseeuw tarafından geliştirilmiştir. Bu

yöntem budanmış hata kareler toplamını minimize etme esasına dayanmaktadır. Bu

yöntemde amaç fonksiyonu şu şekilde tanımlanmaktadır: 13

2( )

1

minq

ii

e=∑ (2.30)

Burada [ ](1 ) 1q n td= − + ’dır. Yöntem budanmış (trimmed) her bir gözlem için

hesaplanan hata karelerinin toplamı şeklinde işlemektedir. Burada td , budanma oranını,

n ise, örneklem büyüklüğünü ifade etmektedir.

13 Andersen R., “Modern Methods for Robust Regression”, SAGE Publications, 2008,

s:49

14

2.3. Fuzzy Regresyon Analizi

Bir fuzzy regresyon modeli, sistemin içermesi gereken olanaklı bütün

gözlemlenmiş veriyi değerlendirir. Bir başka ifade ile fuzzy regresyon modeli,

gözlemlenen tüm verileri içeren bir model oluşturmayı amaçlar. 14

2.3.1. Alt ve Üst Regresyon Doğrularının Hesaplanması

iY bağımlı değişkeni ve jX açıklayıcı değişkenleri reel değerlidirler. Fakat

model parametreleri jA∼

’ler bulanık sayılardır. iY ’nin iY∼

’ye dönüşmesi yani bulanık

olarak kestirilmesinin sebebi; reel değerli açıklayıcı değişkenlerin, bulanık

parametrelerle işleme girmesindendir. 15

1 1 0 0 1 1 1... ( ) ( ) ... ( )U U Uj n jn j n n jnY A X A X m s m s X m s X= + + = + + + + + +

∼ ∼ ∼

(2.31)

1 1 0 0 1 1 1... ( ) ( ) ... ( )L L Lj n jn j n n jnY A X A X m s m s X m s X= + + = − + − + + −

∼ ∼ ∼

(2.32)

Bulanık doğrusal regresyon analizinde belli bir h seviyesinde kesilen bulanık

parametreler üzerinden Y∼

bulanık bağımlı değişkeninin değerleri tahmin edilmektedir.

LY ve UY doğruları h a= seviyesinde hesaplanan h aY = tahmin doğrusunu alttan ve

üstten kapsamaktadırlar.

14 Watada J., Yabuuchi Y., “Fuzzy Robust Regression Analysis”, Department of

Industrial Management, Osaka Institute of Technology, 5-16-1 Omiya, Asahi, Osaka

535 Japan, 0-7803-1896-X/94 1994 IEEE, s:1370-1371

15 Yücel L. Đ., “Bulanık Regresyon : Türkiye’de 1980-2004 Döneminde Kayıt Dışı

Ekonominin Bulanık Yöntemlerle Tahminine Đlişkin Bir Uygulama”, Yüksek Lisans

Tezi, Đstanbul Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2005, s:48

15

Üst regresyon analizinde amaç, [ ] , 1,2,...,Ui ih h

Y Y i N ≤ = kısıtı altında;

U Uj iji j

J s X=∑ ∑ amaç fonksiyonunu minimize eden ( , )U U Ui iA m s=

∼

bulanık

optimal katsayıları bulmaktır.

min U Ui iji j

J s X=∑ ∑ (2.33)

[ ] Ui ih h

Y Y ≤ (2.34)

1,2,..., , 1,2,..., , 0 h 1i n j k= = ≤ ≤

Yukarıda belirtilen doğrusal programlama problemi ile belirtilmek istenen, iY

gözlem değerinin h seviyesinde tahmin edilen UY bulanık tahmin kümeleri tarafından

kapsanması kısıtı altında, U Uj iji j

J s X=∑ ∑ toplam yayılımını minimize ederek

bulanık üst regresyon modelinin parametrelerine ilişkin optimum merkez ve yayılım

değerlerini bulmaktır. 16

L Lj iji j

J s X=∑ ∑ amaç fonksiyonunu minimize eden ( , )L L Li iA m s=

∼

bulanık optimal katsayıları bulmaktır.

min L Li iji j

J s X=∑ ∑ (2.35)

[ ] Li ih h

Y Y ≥ (2.36)

1,2,..., , 1,2,..., , 0 h 1i n j k= = ≤ ≤

16 Yücel L. Đ., s:49

16

Üst regresyon doğrusunun bulunması ile aynı mantık izlenerek, iY gözlem

değerlerinin h seviyesinde tahmin edilen LY bulanık tahmin kümeleri tarafından

kapsanması kısıtı altında, L Li iji j

J s X=∑ ∑ toplam yayılımını minimize ederek

bulanık alt regresyon modelinin parametrelerine ilişkin optimum merkez ve yayılım

değerlerini bulmaktır. 17

Sonuç olarak iY reel değerli gözlem değerlerinin tümü, LY ve UY alt ve üst

regresyonlarının oluşturdukları bulanık doğrusal regresyon aralığında yer almalıdırlar.

Şekil 2.2. LY , UY ve hY α= ’nın Gösterimi 18

17 Yücel L. Đ., s:49-50

18 21 Shapiro A. F., “Fuzzy Regression Models”, Smeal College of Business, University

Park, PA 16802, USA s:5

17

2.3.2. Aralık Regresyonu

Bu yönteme göre, fuzzy (bulanık) veriler ve fuzzy regresyon katsayıları aralık

sayılar olarak ele alınır. Fuzzy regresyon katsayıları, tüm bulanık çıktıların bir fuzzy

regresyon modelinin sınırları içerisinde yer alması düşüncesi ile belirlenir. Kesin (crisp)

X ve kesin (crisp) Y için aralık regresyon modeli Şekil 2.3 ile, Kesin (crisp) X ile

bulanık Y için aralık regresyon modeli Şekil 2.4 ile gösterilmiştir.

Y

X

Şekil 2.3. Kesin (Crisp) X ve Kesin (Crisp) Y için Aralık Regresyon Modeli 19

Y

X

Şekil 2.4. Kesin (Crisp) X ve Bulanık Y için Aralık Regresyon Modeli 20

19 , 20 Düzyurt S., “Bulanık Regresyon ile Tahmin ve Bir Uygulama”, Yüksek Lisans

Tezi, Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Endüstri Mühendisliği Ana Bilim

Dalı, Haziran 2008, Ankara, s:35

18

0 1Y A A X∧

= +∼ ∼

doğrusal modeli için 0 0 0( , )A m s=∼

ve 1 1 1( , )A m s=∼

fuzzy

regresyon katsayılarını elde etmek amacıyla, 21

0 11

min n

ii

ns s X=

+ ∑ (2.37)

0 0 1 1 ,( ) ( ) i=1,2,...,ni i Lm s m s X Y− + − ≥ (2.38)

0 0 1 1 ,( ) ( ) i=1,2,...,ni i Um s m s X Y+ + + ≤ (2.39)

0 10, s 0s ≥ ≥ (2.40)

biçiminde tanımlanan doğrusal programlama problemi çözülür. Burada ,i LY ve ,i UY her

bir bulanık gözlem için sırasıyla alt ve üst sınırları göstermektedir. (2.37) ile belirlenen

amaç fonksiyonu, regresyon modelindeki toplam bulanıklığı gösteren genişliğin en

küçüklenmesidir. (2.38) ve (2.39) kısıtları gözlenen tüm bulanık verileri bulanık

regresyon modeli içerisinde sınırlandırmak üzere kullanılmaktadır.


19

2.3.3. Doğrusal Programlama Modelleri

2.3.3.1. Tanaka Modeli

FLR ( Fuzzy Linear Regression) modelinin genel yapısı aşağıdaki gibidir:

0 1 1 ... 1,2,...,i k kY A A X A X i n= + + + =∼ ∼ ∼ ∼

(2.41)

0 0 1 1 1( , ) ( , ) ... ( , ) 1,2,...,i k k kY m s m s X m s X i n= + + + =∼

(2.42)

Bu modelde bağımlı değişken olan gözlem değerleri jX kesin sayılar olmasına

karşın ilişkinin bulanıklığı nedeni ile bulanık sayı olarak kestirilir. Regresyon

denkleminin hata miktarı, sistem parametrelerinin toplam bulanıklığına eşit olacaktır. 22

Bu nedenden dolayı aynı zamanda regresyon denklemi olan bu modelde, epsilon ( )ε

değeri bulunmamakta ve epsilon, kendini sistem parametrelerinin toplam bulanıklığında

göstermektedir. Bulanıklığı minimize ederek en az hataya ulaşılmış olunur. Bu nedenle

doğrusal programlama yöntemi kullanılarak tahmin değerlerin gözlem değerlerini belirli

bir h seviyesinde içermesi kısıtı altıda bulanık parametrelerin toplam yayılımları

minimize edilir. Uygun ve doğru bir yayılımın elde edilebilmesi, h değerinin

büyüklüğü ile doğru orantılıdır. Diğer bir ifade ile, 0 ile 1 arasında değer alan h değeri

ne kadar 1’e yakınsa, uygun ve doğru bir yayılım elde edilebilmesi olasılığı 1’e

yakındır.

Tanaka modeli aşağıdaki doğrusal modelin çözülmesiyle elde edilir:

0 1 2 ( ... )kMinimize s s s s+ + + + (2.43)

( )0 0 , ( (1 ) ) (1 )j j ij iji için m h s m h s X y∀ + − + + − ≥∑ (2.44)

( )0 0 , ( (1 ) ) (1 ) j j ij iji için m h s m h s X y∀ − − + − − ≤∑ (2.45)


20

0js ≥ (2.46)

1,2,..., , 1, 2,...,i n j k= =

Doğrusal programlama modelinde ifade edilen amaç fonksiyonunda toplam

yayılım minimize edilmeye çalışılmaktadır. Kısıtların olduğu bölümde ise, gözlem

değerlerinin belirlenen h seviyesinde tahmin edilen bulanık küme tarafından içerilmesi

gerektiği formüle edilmiştir. Doğrusal programlama modelinin çözülmesiyle bulanık

sistem parametrelerinin diğer bir ifade ile jA∼

’lerin merkez ve yayılım değerleri

hesaplanılmaktadır.

Bu modelde en önemli varsayım Tanaka’nın belirttiği gibi, iY gözlem

değerlerinin tamamının, tahmin edilen alt ve üst sınır tarafından kapsanması gerektiği

varsayımıdır. Bu nedenden dolayı minimum bulanıklık seviyesine ulaşmak zor olabilir.

Tanaka bu varsayımı aşağıdaki şekilde göstermiştir: 23

1, 2,...,i ih

y Y i n ⊂ =

∼

(2.47)

Bu varsayımın sağlanması için tahmin edilen iY∼

’lerin yayılımı artabilir ve

bulanıklık seviyesi bu durumda genişleyebilir. Eğer verilerde aykırı değer söz konusu

ise bu durum kaçınılmazdır ve istemediğimiz bir durumdur. Bu durumdan kaçınabilmek

için amaç fonksiyonunda sadece js ’leri minimize etmek yerine, aynı zamanda ijX ’ler

de hesaba katılır:

0 j iji jMinimize ns s X+∑ ∑ (2.48)


21

Amaç fonksiyonunun bu şekilde yeniden formüle edilmesi ile doğrusal

programlama problemi aşağıdaki gibi ifade edilir:

0 j iji jMinimize ns s X+∑ ∑ (2.49)

( )0 0 , ( (1 ) ) (1 ) (1 )j j ij i iji için m h s m h s X y h e∀ + − + + − ≥ + −∑ (2.50)

( )0 0 , ( (1 ) ) (1 ) (1 ) j j ij i iji için m h s m h s X y h e∀ − − + − − ≤ − −∑ (2.51)

0js ≥ (2.52)

0 0s ≥ (2.53)

0j ijs X ≥ (2.54)

1, 2,...,i n=

1, 2,...,j k=

22

ja katsayılarının üyelik fonksiyonu aşağıdaki gibidir.

1 , 1, 2,..., ( )

0 , . .j

j j

j j j j j jj jA

m am s a m s k

a s

ö d

µ

−− − < < + ∀ =

=

∼ (2.55)

Şekil 2.5. ja Katsayılarının Üyelik Fonksiyonu 24

24 Shapiro A. F., s:7

23

iY değerlerinin üyelik fonksiyonu ise,

1 , ( )

0 , . .

i

i i

i ii i i iYi

Y YY s Y Y sY

s

ö d

µ

∧

∧ ∧∧

− − − < < +=

(2.56)

şeklindedir.

Şekil 2.6. iY Değerlerinin Üyelik Fonksiyonu 25


24

Elde edilen modelin uygunluğunu ölçmek için aşağıdaki iki istatistik kullanılır.

Bu iki istatistik değerinin mümkün olduğunca küçük olması, modelin uygunluğu

açısından önemlidir. Tanaka uygun bir model için FR1 istatistiğin %5’den, FR2

istatistiğin %10’dan küçük olması gerektiğini öne sürmüştür.

1i i

i

Y YFR

Y

∧

−= (2.57)

2j ij

i

s XFR

Y=∑

(2.58)

Bu doğrusal programlama probleminin çözülmesiyle elde edilen tahminlerin

görünümü aşağıdaki şekilde görüldüğü gibi olacaktır:

Y

X

Şekil 2.7. Tanaka Modelinde Tahminlerin Görünümü 26


25

2.3.3.2. Sakawa & Yano Modeli

Sakawa & Yano, Tanaka modelinindeki i ih

Y Y ⊂

∼

varsayımını esneterek kendi

model yapısını oluşturmuşlardır. Diğer bir ifade ile, Sakawa & Yano, gözlem

değerlerinin tamamının bu aralığa düşmesi yerine, sadece bir kısmının (en az h

kadarının) düşmesini yeterli görmüşlerdir. 27

Y

X

Şekil 2.8. Sakawa & Yano Modelinde Tahminlerin Görünümü 28

2.3.3.3. Peters Modeli

Peters Modeli; Sakawa & Yano modelinin, reel değerli değişkenlere

uygulanması ile bulunmuştur. Bu haliyle Peters modeli, Tanaka modelinin daha fazla

esnetilmiş bir hali olarak kabul edilmektedir. 29

Peters modelinde doğrusal programlama problemi aşağıdaki gibi tanımlanır: 30

1 2 ( ... ) /ortalama nmaksimize nλ λ λ λ= + + + (2.59)

27 , 28 , 29 , 30 Yücel L. Đ., s:56

26

Kısıtı altında;

0 0 , ( ) ( ) (1 )j j j ij i i ii için m s m s X y eλ∀ + + + ≥ − −∑ (2.60)

0 0 , ( ) ( ) (1 )j j j ij i i ii için m s m s X y eλ∀ − + − ≥ + −∑ (2.61)

0 , (1 )j j ij ortalamai için s X P λ∀ ≤ −∑ (2.62)

0 1iλ≤ ≤ (2.63)

i=1,2,…,n j=1,2,…,k (2.64)

0ortalamaλ ≥ ve 0js ≥ (2.65)

Yukarıdaki denklemde h seviyesi yerine λ kullanılmıştır. Buradaki tek fark,

denenmek istenen farklı λ seviyelerinin ortalaması alınarak tek bir bulanıklık seviyesi,

diğer bir ifade ile, ortalamaλ bulunmuştur. Amaç fonksiyonunu maksimize edilmesiyle en

büyük ortalamaλ seviyesi bulunarak, 0 (1 )ortalamaP λ− değeri minimize edilmek

istenmektedir. 31

Şekil 2.9. Peters Modelinde Tahminlerin Görünümü 32

31 , 32 Yücel L. Đ., s:57

27

Peters modelinin eleştirilen yönü, çözümün 0P ’a karşı duyarlı olmasıdır. Bu

değer analist tarafından belirlenir ve yanlış bir seçim yapıldığında model tamamen

amacından sapabilir, sistem parametrelerinin bulanıklığı Tanaka’nın modelindeki

tahmin sınırlarını da aşabilir. 33

2.3.4. Regresyon Katsayılarının Bulandırılması Yöntemi

Regresyon modelinin parametrelerini bulandırarak bulanık regresyon

parametrelerine ulaşmak uygulamada sıkça tercih edilen ve oldukça basit bir yöntemdir.

Klasik Regresyon Analizi ile elde edilen en iyi modelin katsayıları, seçilen bir h

seviyesinde bulandırılır.

Yöntemin adımları aşağıdaki gibi sıralanabilir: 34

1. adım. Klasik regresyon yöntemi ile en uygun model tespit edilir.

2. adım. Açıklayıcı değişkenlerin gözlem değerleri ortalama değerlerinden

saptırılarak bulandırma işlemine başlanır ve klasik regresyon modeli şu hale dönüşür:

0 ( - )xi i i ortalama

i

Y m m X X∧

= +∑ (2.66)

Örneğin iki adet bağımsız değişken olduğunda,

0 1 1 1 2 2 2 ( - ) ( - )xortalama ortalamaY m m X X m X X

∧

= + + (2.67)

ortalamaX değeri tüm gözlem değerlerin aritmetik ortalaması olabileceği gibi,

sadece en büyük ve en küçük gözlem değerlerinin ortalaması alınarak da bulunabilir.

0.5(max min )ortalama j jX X X= + (2.68)


34 Uras Y., “Bulanık Mantığın Doğrusal Regresyon Analizinde Kullanılmasına Đlişkin

Bir Uygulama”, Dokuz Eylül Üniversitesi, 1998, Đzmir, s:101-106

28

3. adım. Bağımsız değişkenler ortalamalarından saptırıldıktan sonra bu adımda

parametreler bulandırılır. Bu işlem alttaki formül kullanılarak gerçekleştirilir.

1 1( ) ( )j j j j J j jL h R hβ δ β β η− −− ≤ ≤ + (2.69)

( ) ( ) 1- L X R X X= = ve j jδ η= olduğunu varsayarak bulandırma yapılır. jA

ve jη ’nin değerleri analist tarafından belirlenir. h seviyesi bir sabit girdi olarak [ ]0,1

aralığından seçilir ve analistin çalışacağı bulanıklık seviyesini ifade eder.

0.5 h = alınırsa, ( ) ( ) 1- 0.5 0.5 L h R h= = = bulunur. Bulandırma

işleminde kullanılmak üzere 1 ( )jL h− ve 1 ( )jR h− değerleri aşağıdaki gibi bulunur:

1 ( )jL h− = 1 ( )jR h− = 1/0.5 = 2 elde edilir.

Bulandırma işlemi sonucunda jβ parametresi için bir alt ve bir üst sınır

hesaplanarak jβ aralığı bulunur. Aslında yapılan işlem aralık regresyonu gibi görünse

de 0h ≠ olduğunda analiz, bulanık regresyon analizidir.

4.adım. Y∼

bulanık değerler tahmin edilir. Diğer bir ifade ile

0 ( )j j j ortalamai

Y X Xβ β= + −∑∼ ∼ ∼

denkleminden hesaplanır.

5.adım. iY∼

tahmin değerleri, iY gözlem değerleri ve klasik regresyondan

tahmin edilen iY∧

’lerle kıyaslanarak hangisinin daha iyi olduğuna ilişkin yorumlar

yapılır.

Bulandırma yöntemine yapılan eleştirilerden en önemlisi, 2. adımda bahsedilen

ortalamaX değeri şayet “ 0.5(max min )ortalama j jX X X= + ” ile hesaplanırsa, aykırı

gözlem olduğu durumlarda sınırlar, olduğundan geniş diğer bir ifade ile daha bulanık

tahmin edilir. Yani aykırı gözlem söz konusu olduğunda ortalamalar max ve min

29

gözlem değerleri ile değil de aritmetik ortalama ile hesaplanırsa bu hassasiyet ortadan

kaldırılabilecektir. 35

2.3.5. Fuzzy En Küçük Kareler (F-EKK) Yöntemi

Fuzzy (Bulanık) En Küçük Kareler (F-EKK) Yöntemi, tahmin edilen ^

iY

bulanık bağımlı değişken değerleri ile gözlenen iY değerleri arasındaki bulanık

mesafeyi minimize etme esasına dayanmaktadır.

^

0 1 1i iY A A X= +∼ ∼

olarak tanımlı FLR modelinde, 0 0 0( , )A m s=∼

ve 1 1 1( , )A m s=∼

olmak üzere, 0m ve 1m merkez değerleri, 0s ve 1s de yayılım değerleridir. Tek

değişkenli FLR modelinde ^

iY bulanık bağımlı değişken değerleri ile gözlenen iY

değerleri arasındaki mesafe (fark) şu denklem ile tanımlanır: 36

2 2

0 1 1 0 1 1 0 0 1 1 1 1

2 20 1 1 0 0 1 1 1 1

( , ) ( , ) ( )

( ) ( )

i i i i i i i i

i i i i i i i

r A A X Y d A A X Y m s m X s X y e

m m X y e m s m X s X y e

+ = + = + + + − −

+ + − − + − + − − −

∑∼ ∼ ∼ ∼

(2.70)

Denkleminin 1. dereceden türevi alınıp sıfıra eşitlenirse, modelin katsayılarına

ilişkin merkez ve yayılım değerlerine ulaşılır. Ancak merkez değerlerinin sıfırdan büyük

olup olmamalarına göre ayrı ayrı çözümler elde edilir: 37

1. Durum: 0 0m > , 1 0m >

Bulanık mesafenin 0m ’a göre 1. dereceden türevi alınıp sıfıra eşitlenirse 0m ’ın

değeri bulunur.

0 1 1 0 0 0 1 1 1 0 0

1 1 1 0 1 1

( , ) / 2 ( ( ) ( ) ( )

( ) ( ) )

i i i i i

i i i i i

r A A X Y m m s m s X y e m s

m s X y e m m X y

∂ + ∂ = − + − − − + +

+ + − + + + −∑

∼ ∼

(2.71)

35 , 36 , 37 Yücel L. Đ., s:60-61

30

1m , 0s ve 1s değerlerini bulmak için de aynı mantık izlenir:

0 1 1 0 0 0 1 1 1 0 0

1 1 1 0 1 1

( , ) / 2 ( ( ) ( )( 1) ( )

( ) ( ) )

i i i i i

i i i i i

r A A X Y s m s m s X y e m s

m s X y e m m X y

∂ + ∂ = − + − − − − + +

+ + − + + + −∑

∼ ∼

(2.72)

0 1 1 1 1 0 0 1 1 1 0 0

1 1 1 0 1 1

( , ) / 2 ( ( ) ( ) ( )

( ) ( ) )

i i i i i i

i i i i i

r A A X Y m X m s m s X y e m s

m s X y e m m X y

∂ + ∂ = − + − − − + +

+ + − + + + −∑

∼ ∼

(2.73)

0 1 1 1 1 0 0 1 1 1 0 0

1 1 1

( , ) / 2 ( ( ) ( ) ( )

( ) ( ))

i i i i i i

i i i

r A A X Y s X m s m s X y e m s

m s X y e

∂ + ∂ = − − + − − − + +

+ + − +∑

∼ ∼

(2.74)

Birinci derecen türev denklemleri sıfıra eşitlenirse 0m , 1m , 0s ve 1s ’in değerleri

hesaplanmış olur.

2 21 ( ) /( ( )i i i i i im n X y X y n X X= − −∑ ∑ ∑ ∑ ∑ (2.75)

0 1ortalama ortalamam y m X= − (2.76)

2 21 ( ) /( ( )i i i i i is n X e X e n X X= − −∑ ∑ ∑ ∑ ∑ (2.77)

0 1ortalama ortalamas e s X= − (2.78)

2. Durum: 0 0m < , 1 0m >




0 1( )ortalama ortalamas e s X= − − (2.82)

31

3. Durum: 0 0m > , 1 0m <




0 1ortalama ortalamas e s X= − (2.86)

4. Durum: 0 0m < , 1 0m <

2 21 1 1( ) /( ( )i i ortalama i i ortalama i im n X y X y n X X= − −∑ ∑ ∑ ∑ ∑ (2.87)


2 21 1 1 1 1( ) /( ( )i i i i i is n X e X e n X X= − − −∑ ∑ ∑ ∑ ∑ (2.89)

0 1( )ortalama ortalamas e s X= − − (2.90)

Tek bağımsız değişkene sahip bir model için bu çıkarımlar söz konusudur.

Birden fazla bağımsız değişkene sahip bir model için farklı çıkarımlar söz konusu

olacaktır. Modelin sahip olduğu bağımsız değişkene göre farklı çıkarımların türetilmesi

yöntemin kullanabilirliği açısından dezavantaj olarak düşünülebilinir.

32

2.3.6. Maksimum Uyum Kriteri ile Fuzzy Regresyon Analizi

Celmins, bulanık en küçük kareler regresyonu için veri ve model tahmini

arasındaki uyum ölçüsüne dayanan bir yaklaşım önermiştir. 38 ( )A

xµ ∼ ve ( )B

xµ ∼ sırasıyla

A∼

ve B∼

bulanık sayılarının üyelik fonksiyonları olmak üzere, A∼

ve B∼

için uyum

ölçüsü ( , )A Bγ∼ ∼

biçiminde gösterilsin. Eğer ( )A

xµ ∼ ve ( )B

xµ ∼ normalleştirilmiş üçgen

üyelik fonksiyonları ise Şekil 2.10’da gösterildiği gibi ( , )A Bγ∼ ∼

,

{ }( , ) max min ( ), ( )x A B

A B x xγ µ µ= ∼ ∼

∼ ∼

(2.91)

biçiminde açıklanır. Burada [ ]0,1γ ∈ olacaktır ve Şekil 2.11’de gösterildiği gibi eğer iki

bulanık sayı örtüşmüyorsa 0γ = , eğer iki bulanık sayısının merkezleri çakışıyorsa 1γ =

değerini alacaktır. 39

Bu yaklaşıma göre amaç, veri ve model arasından maksimum genel uyum

derecesine sahip bir modelin belirlenmesidir. iγ , veri seti ve tahmin denklemi

arasındaki uyum derecesini göstermek üzere; genel uyum ölçüsü iγ ’nin 1’den

sapmalarının kareleri toplamına eşit olacaktır. Burada amaç, 40

2

1

min (1 )m

ii

W γ=

= −∑ (2.92)

biçiminde verilen W fonksiyonunun en küçüklenmesidir.

38 Başer F., “Aktüeryal Modellemede Melez Bulanık Regresyon Analizi”, Yüksek Lisans

Tezi, Ankara Üniversitesi, F.B.E., Đstatistik Ana Bilim Dalı, 2007, s: 21

39 Başer F., s:21


33

µ A∼

B∼

1

(1 )γ−

γ

Şekil 2.10. γ Uyum Ölçüsü 41

µ γ =0 µ γ =1

1 1

Şekil 2.11. γ =0 Uyum Ölçüsü , γ =1 Uyum Ölçüsü 42

41 , 42 Shapiro A. F., s:14

34

Bu yaklaşıma göre maksimum uyum kriterini kullanarak bulanık en küçük

kareler regresyonu için model,

0 1Y A A X∧

= +∼ ∼

(2.93)

2 2 20 1 0 01 12m m X s s X s X= + ± + + (2.94)

biçiminde oluşturulur. 43

(2.94) denkleminin ilk kısmı olan 0 1m m X+ , bulanık regresyon modelinin

merkez doğrusunu göstermektedir. 0m ve 1m katsayıları ağırlıklı en küçük kareler

regresyonu yardımıyla elde edilir. (2.94) denkleminin ikinci kısmı

2 2 20 01 12s s X s X± + + , bulanık regresyon modelinin alt ve üst sınırlarını göstermektedir.

0s ve 1s ise 0A∼

ve 1A∼

bulanık katsayılarının genişliklerini ifade etmektedir. Celmins’e

göre 01s , 0A∼

ve 1A∼

arasındaki bulanık uyumluluk olarak tanımlanmıştır ve klasik

parametrelerdeki kovaryansa karşılık gelmektedir. Đteratif hesaplamalar sonucunda 0s ,

1s ve 01s , [ ]0,1 aralığı içerisinde elde edilir. 44

2.3.7. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı

iY simetrik üçgensel fuzzy sayısı, { }( , ) 1,2,...,i i iY m s i n≡ ∈ biçiminde

tanımlanabilir. Lineer regresyon analizini ise matris formatında şu şekilde

tanımlayabiliriz: 45

mε*m = m + burada *m = Xa , (2.95)

sε*s = s + burada b d+* *s = m 1 . (2.96)


44 Başer F., s:23

45 D’Urso P., Gastaldi T., “A Least-Squares Approach to Fuzzy Linear Regression

Analysis”, Computational Statistics & Data Analysis 34 (2000) s:430

35

Burada X ; x ( 1)n k + boyutlu girdi verilerinden oluşan matrisi, a ; regresyon

parametrelerini içeren 1 x ( 1)k + boyutlu vektörü, m ve *m ; sırasıyla gözlenen ve

tahmin edilen çıktı verilerinden oluşan, her ikisi de x 1n boyutlu matrisi, s ve *s ;

sırasıyla gözlenen ve tahmin edilen yayılımlardan oluşan, her ikisi de x 1n boyutlu

matrisi, 1 ; bütün değerleri 1’den oluşan x 1n boyutlu vektörü, b ve d ; yayılım

regresyon modeli olarak adlandırılan ikinci regresyon modelinin parametrelerini ifade

etmektedir.

* * *( , ) ve ( , )i i i i i iY m s Y m r≡ ≡ arasındaki öklid uzaklık şu şekilde tanımlanabilir:

* * 2 * 2( , ) ( ) ( )i i i i i i iY Y m m s sδ δ≡ = − + − . (2.97)

Fuzzy lineer regresyon analizine EKK yaklaşımı öklid uzaklıklarının toplamını

minimize etme esasına dayanmaktadır. 46

2

1

( , , ) .n

ii

b dϕ δ=

≡ =∑ * * * *a (m - m )'(m - m ) + (s - s )'(s - s ) (2.98)

EKK’nın iteratif çözümü sonrasında parametre değerlerin kestirimi şu şekilde

olacaktır. 47

1

2

1

1(( ) ( )),

(1 )

( ) ( ),

1( ).

b bdb

b d

d bn

−

−

= −+

=

=

a X'X X' m + s 1

a'X'Xa s'XA - a'X'1

s'1- a'X'1

(2.99)

46 , 47 D’Urso P., Gastaldi T., s:430

36

2.4. Fuzzy Robust Regresyon Analizi

Fuzzy Robust Regresyon yaklaşımı, veri seti üzerindeki düzensiz verilerin

model üzerindeki etkisini azaltmak amacıyla kullanılan bir yöntemdir. Ishibuchi, bazı

marjinal etkiye sahip verileri silmeye yönelik bir yaklaşım önermiştir. Watana ve

Yabuuchi, genetik algoritma yöntemini kullanarak düzensiz verileri içerisinde

barındıran bir yaklaşım önermiştir. Ayrıca Watana ve Yabuuchi, hipereliptik fonksiyona

( 2 ( )y f x= ) dayanan bir robust FLR yaklaşımı önermiştir. Chen, önceden belirlenmiş

k sınırlayıcı (pre-assigned k -limiting) yöntemini kullanarak modifiye güven aralığı

yöntemini önermiştir. Yang ve Liu, gürültü küme (noise cluster) yöntemini kullanarak

yeni bir fuzzy en küçük kareler algoritmasını önermişler ve bu algoritma ile düzensiz

verilerin model üzerinde olumsuz etkilerini gidermeye çalışmışlardır.

2.4.1. M-Kestiricisi’ne Dayanan Fuzzy Robust Regresyon Analizi

Fuzzy robust regresyon modeli, modeldeki tüm verilerle inşa edilmeye,

oluşturulmaya çalışılır. Gerçek dünyada veriler arasında düzensiz verilerin bulunması

kaçınılmazdır. Bu düzensiz veriler, gözlenen değerlerdeki hatalardan, gözlem

metotlarındaki eksiklik, hata veya yanlışlıklardan, gözlenen değerlerin kaybolmasından,

verinin aykırı ya da uç değer olmasından ya da diğer nedenlerden kaynaklanmaktadır.

Bunun sonucu olarak, bu tip verileri klasik regresyon yaklaşımı ile kurmaya

çalıştığımızda, kurulan model gerçekliğini yitirmektedir. Bu yüzden bu yaklaşımda

düzensiz verilerin model üzerindeki etkisi, modelin kurulması aşamasında ortadan

kaldırılması amaçlanmaktadır. 48

Üçgen fuzzy sayısı, 1 ja ve 3 ja iki uç noktayı, 2 ja merkez noktayı göstermek

üzere, 1 2 3( , , )j j j jA a a a= bulanık aralığı olarak tarif edilebilinir.

48 Watada J., Yabuuchi Y., s:1370

37

0 1 ... 1,...,i ij j ijY A A x A x i n= + + + = (2.100)

olmak üzere, jA ’nin üyelik fonksiyonu: 49

1

2

1 2

2 1

3

2 3

3 2

3

0 ,

1 ,

( )

1 ,

0 ,

i

j

jj j

j j

A

jj j

j j

j

x a

a xa a

a ax

x aa a

a a

x a

µ

<

− − ≤ −=

− − ≤ −

>

(2.101)

ve ( )( ) ( )1 3,h h

jh j jA a a= , h -kesit (cut) aralığıdır. Burada ( )1 1 2 1( )h

j j j ja a a a h= + − ve

( )3 3 3 2( )h

j j j ja a a a h= − − ‘dir. Fuzzy üçgen sayılarla oluşturulan FLR model: 50

*10 20 30 0 11 21 31 1 1 2 3

1 2 3

( , , ) ( , , ) ... ( , , )

, ,

j i i j j j ij

j ij j ij j ijj j j

Y a a a x a a a x a a a x

a x a x a x

= + + +

= ∑ ∑ ∑

(2.102)

‘dir.

49 , 50 Sohn B. Y., “Robust Fuzzy Linear Regression Based on M-estimators”, J. App1.

Math. & Computing Vol:18, No:1-2, 2005, s:596

38

Bu modele ait üyelik fonksiyonu ise; 51

*

1

2

1 2

2 1

3

2 3

3 2

3

0 ,

1 , ( )

( )

1 , ( )

0 ,

i

j ijj

jj

j ij j ijj jj j ij

j

Yj

jj ij j ij

j jj j ijj

j ijj

y a x

a y

a x y a xa a x

yy a

a x y a xa a x

y a x

µ

< −

− ≤ ≤−

= −

− ≤ ≤−

>

∑

∑∑ ∑∑

∑∑ ∑∑

∑

(2.103)

‘dir.

Aşağıdaki fuzzy lineer programlama probleminin çözümü ile 1 ja , 3 ja ve 2 ja

tahmin edilebilinir. 52

( ) ( )1 1

2 1 3 20 0 0 0

p pn n

j j ij j j iji j i j

Minimize a a x a a x− −

= = = =

− + −∑∑ ∑∑ (2.104)

Kısıtı altında;

( )

( )

2 2 1

2 2 1

2 1

3 2

, (1 ) (1 )

, (1 ) (1 )

( ) 0

( ) 0

j j j ij ij j

j j j ij ij j

j j

j j

i için a h a a x y h e

i için a h a a x y h e

a a

a a

∀ − − − ≤ − −

∀ − − − ≥ + −

− ≥

− ≥

∑ ∑

∑ ∑ (2.105)

51 Sohn B. Y., s:596

52 Sohn B. Y., s:597

39

Sırasıyla uç noktalar olan 1 j ijj

a x∑ ve 3 j ijj

a x∑ fuzzy üçgen sayıları alt limit

çizgisi ve üst limit çizgisidir (Şekil 2.12). Aykırı değer çıktısına sahipsek Şekil 2.13 ‘de

görüldüğü gibi üst ve alt limit sınırları aykırı değeri kapsamaktadır.

Şekil 2.12. FLR Model 53 Şekil 2.13. FLR Model ile Aykırı Değer 54

Merkez nokta olan 2 ja ’nin ve artık olarak mjr ’nin M- Kestirici yöntemiyle

tanımlanması aşağıdaki gibidir: 55

mj i mj ijj

r y a x= −∑ . (2.106)

3 1( )mjIQR r Q Q= − (2.107)

Burada 1Q ve 3Q , sırasıyla birinci ve üçüncü kartillerdir. Düzensiz çıktı verisi,

sınırı aşan arama puanlama yöntemiyle bulunabilir.

1 31.5 x ( ) veya 1.5 x ( )mj mjQ IQR r Q IQR r− + (2.108)

53 , 54 Sohn B. Y., s:595

55 Sohn B. Y., s:597

40

Şimdi mh ’yi tanımlayalım. 56

i mi mim

i mi

y y rh

y y

−= = (2.109)

Burada mi mj ijj

y a x=∑ ’dir. i . çıktı verisi düzensiz ise (2.105) nolu kısıtlar

altındaki i . kısıtın h ve iy ’si, M - Kestirim Yöntemine dayanan mh ve uydurulmuş

değer olan miy tarafından değiştirilir.

Büyük değer iy , büyük yayılımın ve düzensiz çıktı verisinin etkisini azaltmak

için, mh ve miy tarafından küçültülür. 57

2.4.2. Girdi Değişkenlerinin Fuzzy (Bulanık) Olması Durumunda

Robust Regresyon Analizi

Çoklu doğrusal regresyon modeli;

0 1 1 2 2 ... p pY X X Xβ β β β ε= + + + + + (2.110)

şeklindedir. Aşağıda çoklu doğrusal regresyon modeli ele alınarak, genelleştirilmiş bir

lemma olarak verilmiştir.

Lemma: Çoklu doğrusal regresyon durumunda genelleştirilmiş optimizasyon

problemi, 58

20 1 2 0 1 1 2 2: ( , , ,..., ) ( ... , )p i i p pi iP Minimize r b b b b d b b X b X b X Y= + + + +∑ (2.111)

56 , 57 Sohn B. Y., s:597

58 Şanlı K., Apaydın A., “The Fuzzy Robust Regression Analysis, The Case of Fuzzy

Data Has Outlier” G.Ü. Fen Bilimleri Dergisi, 2004, s:77

41

olarak yazılmaktadır. Burada 0 1 2, , ,..., pb b b b kesin sayılar, ( ), ,i i i iX x ζ ζ= ,

( , , )i i i iY y η η= üçgen bulanık sayılar olmak üzere,

2

0 1 1 0 1 1 2 2 1 1 2 2( ... , ) ... ( ... )i p pi i i i p pi i p p id b b X b X Y b b x b x b x y b b bζ ζ ζ η + + + = + + + + − − + + + −

2

0 1 1 2 2 1 1 2 2... ( ... )i i p pi i p p ib b x b x b x y b b bζ ζ ζ η + + + + + − + + + + −

( )2

0 1 1 2 2 ...i i p pi ib b x b x b x y+ + + + + − (2.112)

‘dir. P probleminin en küçüklenmesi sonucunda,

' ' ' 1 ' ' '( ) ( )X X A A B B X Y AC B Dβ∧

−= + + + + (2.113)

olarak bulunur. 59 Burada iX ’e ait ( ), ( )i isol yayılım sağ yayılımζ ζ ve iY ’ye ait

( ), ( )i isol yayılım sağ yayılımη η analist tarafından belirlenmektedir.

Literatüre baktığımızda genellikle iX ’e ait ( ) / 7i isol yayılım xζ = ,

( ) / 6i isağ yayılım xζ = olarak, iY ’ye ait ( ) / 8i isol yayılım yη = , iY ’ye ait

( ) / 7i isağ yayılım yη = olarak belirlendiğini görmekteyiz. Yayılım değeri negatif bir

sayı olamayacağından yayılımlar mutlak değer cinsinden hesaplanır.

Burada,

11 1

12 2

1

1

1

1

p

p

n pn

x x

x xX

x x

=

⋯

⋯

⋮ ⋮ ⋮

⋯

1

2

n

y

yY

y

=

⋮

1 1

2 2

n n

y

yC

y

η

η

η

−

− = −

⋮

1 1

2 2

n n

y

yD

y

η

η

η

+

+ = +

⋮

59 Şanlı K., Apaydın A., s:77

42

11 11 1 1

12 12 2 2

1 1

1 ( ) ( )

1 ( ) ( )

1 ( ) ( )

p p

p p

n n pn pn

x x

x xB

x x

ζ ζ

ζ ζ

ζ ζ

+ + + +

= + +

⋯

⋯

⋮ ⋮ ⋮

⋯

11 11 1 1

12 12 2 2

1 1

1 ( ) ( )

1 ( ) ( )

1 ( ) ( )

p p

p p

n n pn pn

x x

x xA

x x

ζ ζ

ζ ζ

ζ ζ

− −

− − =

− −

⋯

⋯

⋮ ⋮ ⋮

⋯

olarak tanımlanır. Gözlem sayısı 1, 2,...,i n= ve değişken sayısı 1, 2,...,j p= ’dir.

Parametre tahminlerinin elde edilebilmesi için ( ' ' 'X X A A B B+ + )’nin tersinin

alınabilmesi gerekmektedir.

2.4.3. Şanlı K. ve Apaydın A.’nın Önerdiği Algoritma

Şanlı K. ve Apaydın A., model parametrelerinin kesin sayı, merkezlerinin sıfır

olması gibi bazı dezavantajları gidermeye yönelik bir algoritma geliştirmişlerdir. Bu

nedenle önerdikleri algoritmada tanımlı β∧

’ların tahmininde ağırlık matrisi üyelik

fonksiyonları yardımıyla tanımlamışlar, üyelik matrisinin tanımlanmasında uzaklık

kullanmışlar ve üyelikler kullanılarak ağırlıklandırılmış bulanık en küçük kareler tahmin

edicisi elde etmişlerdir. Önerdikleri algoritma adım adım aşağıda verilmiştir. 60

Adım 1 : ( , , )i i i iX x ζ ζ= , ( , , )i i i iY y η η= üçgensel bulanık sayıları için

parametre tahmini Eşitlik (2.113)’dan elde edilir.

Adım 2 : jY∧

tahmin değerleri ve artıklar ( )ie hesaplanır.

Adım 3 : Artıkların mutlak değerlerine göre medyanı belirlenir ve

( ) ( ( )) ( )id i abs e i medyan e= − (2.114)

uzaklığı hesaplanır. Burada . öklid uzaklığıdır.

60 Şanlı K., Apaydın A., s:78

43

Adım 4 : Uzaklıklara bağlı olarak üyelik fonksiyonu

1

( )

0 ö.d.

e a

b ex a e b

b aµ

≤

−= < <

−

(2.115)

biçiminde tanımlanır. Burada,

( ( ))a medyan d i= (2.116)

max( ( ))b d i= (2.117)

dir.

Adım 5 : Eşitlik (2.115)’de tanımlanan üyelik fonksiyonundan üyelik

dereceleri belirlenir ve ağırlık matrisi ( )W oluşturulur. Ağırlık matrisi köşegen

elemanları üyeliklerden oluşan diagonal matristir. Eşitlik (2.113)’den ağırlıklandırılmış

bulanık en küçük kareler tahmin edicisi,

' ' ' 1 ' ' '( ) ( )X WX AWA BWB X WY AWC BWDβ∧

−= + + + + (2.118)

biçiminde tanımlanır. Bu tahmin edici kullanılarak parametre tahmini yapılır.

Adım 6 : Eğer 1k k

β β ε+∧ ∧

− < ise durulur. Aksi durumda Adım 2’ye gidilir.

Burada β∧

tahmin edilen regresyon model parametreleri, k iterasyon sayısı ve 0ε >

olmak üzere çok küçük bir sayıdır.

44

3. OTOMOBĐL BEĞENĐ DEĞERĐ FONKSĐYONUNUN

BELĐRLENMESĐNDE DÖRT TEKNĐĞĐN KARŞILAŞTIRILMASI

Çoklu Doğrusal Regresyon Analizi ile bulunan modelin diğer üç teknikle

(Robust Regresyon Analizi, Fuzzy Regresyon Analizi, Fuzzy Robust Regresyon

Analizi) nasıl sonuç verdiği otomobil beğeni değerleri için, gözlenen 45 otomobil

markası verileriyle denenmiştir. Çoklu doğrusal regresyon çalışmasında Otomobil

Beğeni Değeri’ni açıklamada sekiz açıklayıcı değişken olarak otomobil’in fiyatı, silindir

hacmi, beygir gücü, maksimum hız, saniyede 0’dan 100 km/saat’e çıkma süresi, 100

kilometrede şehir dışı kaç litre yaktığı, 100 kilometrede şehir içinde kaç litre yaktığı ve

bir kilometre gitmenin maliyeti belirlenmiştir. Aynı değişkenlerle diğer üç tekniğin nasıl

sonuç vereceği araştırılmıştır.

1X , 2X , 3X , 4X , 5X , 6X , 7X , 8X ,ve Y değerleri;

1X : Otomobilin Fiyatını’nı (TL),

2X : Otomobilin Silindir Hacmi’nı (cc),

3X : Otomobilin Beygir Gücü’nü (HP),

4X : Otomobilin Maksimum Hızı’nı (km/saat),

5X : Otomobilin Saniyede 0’dan 100 km/saat’e Çıkma Süresi’ni (saniye),

6X : Otomobilin 100 Kilometrede Şehir Dışında Kaç Litre Yaktığı’nı (litre),

7X : Otomobilin 100 Kilometrede Şehir Đçinde Kaç Litre Yaktığı’nı (litre),

8X : Otomobilin Bir Kilometre Gitmesinin Maliyeti’ni

6 7(( ) / 2).

100 10000 15000 15000 25000 30000

X X Yakıt Fiyatı Bakım Ücreti Yıllık Vergi Trafik Sigortası

veya veya veya

+ ++ +

Y : Otomobil Beğeni Değeri’ni ([ ]0 10− aralığı üzerinden) ifade etmektedir.

45

Fuzzy hedef çıktısı ( iY ) aşağıdaki şekilde oluşturulmuştur:

1 2 3 4 5 6 7 8( , , , , , , , , ), 1,..., 45 1,...,8.i j i i i i i i i iy f x x x x x x x x i j= = = (3.1)

Bir sonraki sayfada Tablo 1’deki s (spread) yayılım değerleri ise, gözlenen

otomobil beğeni değerinin minimum veya maksimum değerleri yardımıyla aşağıdaki

gibi hesaplanmıştır.

min maxi i i i is Y Y Y Y= − = − (3.2)

Ayrıca 'APE adında bir hata ölçütü tanımlanmıştır. 61

'APE ne kadar küçükse tahmin değerleri o denli başarılı olduğunu

söyleyebiliriz.

1

1'

i iN

i i

Y YAPE

N Y

∧

=

−= ∑ , (3.3)

61 Cheng C., Lee E. S., “Fuzzy Regression with Radial Basis Function Network”, Fuzzy

Sets and Syatems 119 (2001), s:29

46

Tablo 1: Girdi Değişken Verileri ve Hedef Çıktılar n X1 X2 X3 X4 X5 X6 X7 X8 Ymin Y Ymax s

1 57997,768 1598 122 203 7,6 4,8 7,6 0,40 7,0 7,35 7,7 0,4 2 44600 1290 124 185 11,9 5,9 9 0,43 7,9 8,1 8,3 0,2 3 96173,64 1480 156 230 9,5 5,7 9,9 0,53 4,6 6,45 8,3 1,9 4 60642,512 1390 122 203 8,9 4,4 6,8 0,43 7,3 7,55 7,8 0,3 5 28170 1390 85 174 12,3 5,3 8,6 0,42 7,2 7,45 7,7 0,3 6 46600 1598 120 190 10,9 5,3 9,6 0,41 7,5 7,85 8,2 0,4 7 55980 1368 120 195 9,4 5,4 8,6 0,41 8,1 8,2 8,3 0,1 8 93169 1956 160 218 9,5 4,7 7,7 0,41 7,6 7,75 7,9 0,2 9 33908 1598 124 190 10,9 5,1 8,8 0,39 7,7 7,95 8,2 0,3 10 23900 1086 69 156 15 4,1 5,8 0,28 7,5 7,75 8,0 0,3 11 27516 1206 81 164 12,1 4,2 6,6 0,31 7,3 7,65 8,0 0,4 12 37175 1368 120 197 9,6 5,5 8,6 0,40 7,2 7,35 7,5 0,2 13 57730 1598 156 204 10,9 5,4 8,8 0,42 7,4 7,45 7,5 0,0 14 33900 1396 108 185 11,5 4,8 7,8 0,36 7,6 7,8 8,0 0,2 15 48163 1398 140 202 9,9 4,7 7,8 0,37 7,3 7,45 7,6 0,2 16 55000 1598 120 203 11,5 4,6 9 0,39 7,1 7,4 7,7 0,3 17 39800 1197 105 187 10,9 4,9 7,1 0,34 8,0 8,1 8,2 0,1 18 29282 1240 80 167 13,5 5,1 7,4 0,35 7,0 7,35 7,7 0,4 19 61700 1390 122 205 10,3 5,2 7,3 0,38 7,5 7,65 7,8 0,1 20 29904 1368 77 165 13,2 5 7,5 0,36 7,5 7,6 7,7 0,1 21 39100 1582 90 172 13,8 4,2 5,7 0,29 7,7 7,9 8,1 0,2 22 23990 1248 74 170 16 4 6,4 0,26 7,1 7,4 7,7 0,3 23 48900 1364 90 175 11,9 4,0 5,6 0,29 7,9 8,1 8,3 0,2 24 42600 1598 90 180 11,5 3,7 5,2 0,26 7,3 7,5 7,7 0,2 25 59700 1560 112 190 12,8 4,5 6,4 0,32 7,5 7,55 7,6 0,0 26 44170 1598 105 190 11,8 3,9 5,7 0,29 7,8 7,9 8,0 0,1 27 56850 1461 110 182 12,5 4,4 6,1 0,31 7,1 7,2 7,3 0,1 28 61578 1598 105 185 11,3 3,7 5,5 0,28 8,1 8,2 8,3 0,1 29 55300 1598 105 190 11,7 4,2 5,6 0,29 7,8 7,95 8,1 0,2 30 44600 1595 102 188 11,3 5,5 8,8 0,37 7,5 7,75 8,0 0,3 31 37200 1598 90 178 11,8 3,6 5,1 0,26 7,2 7,3 7,4 0,1 32 39430 1560 90 173 13,4 4,1 6,1 0,28 7,0 7,25 7,5 0,3 33 39300 1598 110 183 11,7 5,3 8,8 0,36 7,6 7,8 8,0 0,2 34 56019 1248 95 170 14,7 3,6 5,1 0,25 7,3 7,45 7,6 0,2 35 37050 1598 110 185 11,7 5,3 8,8 0,36 7,1 7,2 7,3 0,1 36 48700 1461 105 185 10,9 4 5,5 0,28 7,1 7,2 7,3 0,1 37 80600 1598 200 237 7,5 5,6 9,1 0,43 8,0 8,25 8,5 0,3 38 72649,6 1390 160 218 8 5,4 8,7 0,43 7,8 8,15 8,5 0,4 39 49600 1560 156 214 7,3 5,1 9,4 0,41 7,5 7,85 8,2 0,4 40 39970 1197 105 175 11,8 5,9 7,9 0,39 7,7 7,85 8,0 0,2 41 47750 1598 120 195 11,6 5,6 9,8 0,44 7,4 7,65 7,9 0,3 42 34400 1598 105 160 12,8 7 10,4 0,48 7,7 8,1 8,5 0,4 43 75900 1987 158 185 11 6,5 9,6 0,53 7,4 7,7 8,0 0,3 44 28370 1198 70 158 15,9 5,5 8,7 0,39 7,5 7,7 7,9 0,2

45 42750 1591 125 178 12,2 5,8 9 0,41 7,7 7,9 8,1 0,2

Kaynak: Otohaber Test Yıllığı 2011, Auto Show Dergisi Sayı:26, car.tr.diploptop.com ( min maxi i i i is Y Y Y Y= − = − )

47

3.1. Regresyon Analizi

Gözlem değerleri ile Bölüm 2.1‘de açıklanan Çoklu Doğrusal Regresyon

Analizi çalışması SPSS programıyla yapılmış ve aşağıdaki sonuçlar bulunmuştur.

Çıktıya baktığımızda oluşturulan regresyon denkleminin

1 3 4 5 6 7 811.645 2.348 6 0.009 0.019 0.101 0.233 0.042 4.589Y E X X X X X X X∧

= + − + − − + + −

olduğunu ve 2R ’nin 0.268 olduğunu görmekteyiz. Bu sonuca göre, bağımlı

değişkendeki %26.8’lik değişim modele dahil ettiğimiz bağımsız değişkenler tarafından

açıklanmaktadır. ANOVA tablosuna baktığımızda, tablodaki 1.643 F değeri,

modelimizin bir bütün olarak anlamlı olmadığını göstermektedir (Sig.=0.147>0.05).

48

Katsayılar tablosunda 0β , 1β , 2β , 3β , 4β , 5β , 6β , 7β , 8β için bulunan 0b , 1b ,

2b , 3b , 4b , 5b , 6b , 7b , 8b istatistikleri kullanılarak 0 0: 0H β = , 0 1: 0H β = , 0 2: 0H β = ,

0 3: 0H β = , 0 4: 0H β = , 0 5: 0H β = , 0 6: 0H β = , 0 7: 0H β = , 0 8: 0H β = hipotezleri

için sınama sonuçları görülmektedir. 0 0: 0H β = hipotezi için elde edilen sig. değeri

dışında diğer hipotezler için elde edilen sig. değeri %5 ’den büyük çıkmıştır. Sonuç

olarak 0 0: 0H β = hipotezi %95 güven düzeyinde reddedilmiş, hesaplanan istatistiğin

sıfır olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven düzeyinde

reddedilememiş, hesaplanan istatistiklerin sıfır olduğu belirlenmiştir. Modelin bir bütün

olarak anlamlı bulunmamasından ve en az bir bağımsız değişkenin anlamlı

bulunmamasından dolayı elimizdeki veri seti için çoklu doğrusal regresyon analizinin

uygun olmadığına karar verilmiştir.

3.2. Robust Regresyon Analizi

3.2.1. LMS (Least Median of Squares) Kestiricisi Yöntemi ve RLS

Bu analizde, veri seti üzerine, Bölüm 2.2.2.1.2. ‘de açıklanan LMS Kestirme

Yöntemi ve LMS’ye dayalı yeniden ağırlıklandırılmış EKK Yöntemi (RLS) SAS/IML

programı ile yapılmış ve aşağıdaki sonuçlar bulunmuştur.

49


1 2 3 4 5 6 7 86.45 1.52 5 8.65 04 0.015 0.00295 0.021 0.413 0.074 2.069Y E X E X X X X X X X∧

= − − − − + + + + − −

olduğunu ve Robut 2R ’nin 0.52 olduğunu görmekteyiz. Bu sonuca göre, bağımlı

değişkendeki %52’lik değişim, modele dahil ettiğimiz bağımsız değişkenler tarafından

açıklanmaktadır.

50

Tablo 2: Girdi Değişken Verileri, Hedef Çıktılar ve LMS’den Elde Edilen Y*, e

n X1 X2 X3 X4 X5 X6 X7 X8 Y Y* e

1 57997,768 1598 122 203 7,6 4,8 7,6 0,40 7,35 7,36 -0,01 2 44600 1290 124 185 11,9 5,9 9 0,43 8,1 8,20 -0,10 3 96173,64 1480 156 230 9,5 5,7 9,9 0,53 6,45 7,45 -1,00 4 60642,512 1390 122 203 8,9 4,4 6,8 0,43 7,55 7,36 0,19 5 28170 1390 85 174 12,3 5,3 8,6 0,42 7,45 7,55 -0,10 6 46600 1598 120 190 10,9 5,3 9,6 0,41 7,85 7,57 0,28 7 55980 1368 120 195 9,4 5,4 8,6 0,41 8,2 7,74 0,46 8 93169 1956 160 218 9,5 4,7 7,7 0,41 7,75 7,12 0,63 9 33908 1598 124 190 10,9 5,1 8,8 0,39 7,95 7,85 0,10 10 23900 1086 69 156 15 4,1 5,8 0,28 7,75 7,65 0,10 11 27516 1206 81 164 12,1 4,2 6,6 0,31 7,65 7,55 0,10 12 37175 1368 120 197 9,6 5,5 8,6 0,40 7,35 8,10 -0,75 13 57730 1598 156 204 10,9 5,4 8,8 0,42 7,45 8,07 -0,62 14 33900 1396 108 185 11,5 4,8 7,8 0,36 7,8 7,79 0,01 15 48163 1398 140 202 9,9 4,7 7,8 0,37 7,45 8,00 -0,55 16 55000 1598 120 203 11,5 4,6 9 0,39 7,4 7,29 0,11 17 39800 1197 105 187 10,9 4,9 7,1 0,34 8,1 7,96 0,14 18 29282 1240 80 167 13,5 5,1 7,4 0,35 7,35 7,74 -0,39 19 61700 1390 122 205 10,3 5,2 7,3 0,38 7,65 7,78 -0,13 20 29904 1368 77 165 13,2 5 7,5 0,36 7,6 7,49 0,11 21 39100 1582 90 172 13,8 4,2 5,7 0,29 7,9 7,36 0,54 22 23990 1248 74 170 16 4 6,4 0,26 7,4 7,59 -0,19 23 48900 1364 90 175 11,9 4,0 5,6 0,29 8,1 7,28 0,82 24 42600 1598 90 180 11,5 3,7 5,2 0,26 7,5 7,16 0,34 25 59700 1560 112 190 12,8 4,5 6,4 0,32 7,55 7,42 0,13 26 44170 1598 105 190 11,8 3,9 5,7 0,29 7,9 7,38 0,52 27 56850 1461 110 182 12,5 4,4 6,1 0,31 7,2 7,50 -0,30 28 61578 1598 105 185 11,3 3,7 5,5 0,28 8,2 7,04 1,16 29 55300 1598 105 190 11,7 4,2 5,6 0,29 7,95 7,33 0,62 30 44600 1595 102 188 11,3 5,5 8,8 0,37 7,75 7,57 0,18 31 37200 1598 90 178 11,8 3,6 5,1 0,26 7,3 7,20 0,10 32 39430 1560 90 173 13,4 4,1 6,1 0,28 7,25 7,30 -0,05 33 39300 1598 110 183 11,7 5,3 8,8 0,36 7,8 7,70 0,10 34 56019 1248 95 170 14,7 3,6 5,1 0,25 7,45 7,34 0,11 35 37050 1598 110 185 11,7 5,3 8,8 0,36 7,2 7,74 -0,54 36 48700 1461 105 185 10,9 4 5,5 0,28 7,2 7,47 -0,27 37 80600 1598 200 237 7,5 5,6 9,1 0,43 8,25 8,44 -0,19 38 72649,6 1390 160 218 8 5,4 8,7 0,43 8,15 8,05 0,10 39 49600 1560 156 214 7,3 5,1 9,4 0,41 7,85 8,04 -0,19 40 39970 1197 105 175 11,8 5,9 7,9 0,39 7,85 8,19 -0,34 41 47750 1598 120 195 11,6 5,6 9,8 0,44 7,65 7,64 0,01 42 34400 1598 105 160 12,8 7 10,4 0,48 8,1 7,98 0,12 43 75900 1987 158 185 11 6,5 9,6 0,53 7,7 7,61 0,09 44 28370 1198 70 158 15,9 5,5 8,7 0,39 7,7 7,65 0,05

45 42750 1591 125 178 12,2 5,8 9 0,41 7,9 7,96 -0,06

51

1

1' 0.038

i iN

i i

Y YAPE

N Y

∧

=

−= ≅∑ olarak hesaplanmıştır.

Bu tabloda, 0β , 1β , 2β , 3β , 4β , 5β , 6β , 7β , 8β için bulunan 0b , 1b , 2b , 3b ,

4b , 5b , 6b , 7b , 8b istatistikleri kullanılarak 0 0: 0H β = , 0 1: 0H β = , 0 2: 0H β = ,


için sınama sonuçları görülmektedir. 0 0: 0H β = hipotezi için elde edilen t değeri

dışında diğer hipotezler için elde edilen t değeri %5’den büyük çıkmıştır. Sonuç

olarak 0 0: 0H β = hipotezi %95 güven düzeyinde reddedilmiş, hesaplanan istatistiğin

sıfır olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven düzeyinde

reddedilememiş, hesaplanan istatistiklerin sıfır olduğu belirlenmiştir. LMS’ye dayalı

yeniden ağırlıklandırılmış EKK Yöntemi (RLS) ile anlamlı bir model kurulamamıştır.

52

3.2.2. LTS (Least Trimmed Squares) Kestiricisi Yöntemi ve RLS

Bu analizde, veri seti üzerine, Bölüm 2.2.2.1.4. ‘de açıklanan LTS Kestirme

Yöntemi ve LTS’ye dayalı yeniden ağırlıklandırılmış EKK Yöntemi (RLS) SAS/IML

programı ile yapılmış ve aşağıdaki sonuçlar bulunmuştur.


1 2 3 4 5 6 7 811.93 3.885 7 9.845 04 0.01 0.0154 0.124 0.218 0.107 3.98Y E X E X X X X X X X∧

= − − − − − − − + + −

olduğunu ve Robut 2R ’nin 0.79 olduğunu görmekteyiz. Bu sonuca göre, bağımlı

değişkendeki %79’lik değişim, modele dahil ettiğimiz bağımsız değişkenler tarafından

açıklanmaktadır.

53

Tablo 3: Girdi Değişken Verileri, Hedef Çıktılar ve LTS’den Elde Edilen Y*, e

n X1 X2 X3 X4 X5 X6 X7 X8 Y Y* e

1 57997,768 1598 122 203 7,6 4,8 7,6 0,40 7,35 7,74 -0,39 2 44600 1290 124 185 11,9 5,9 9 0,43 8,1 8,11 -0,01 3 96173,64 1480 156 230 9,5 5,7 9,9 0,53 6,45 7,47 -1,02 4 60642,512 1390 122 203 8,9 4,4 6,8 0,43 7,55 7,49 0,06 5 28170 1390 85 174 12,3 5,3 8,6 0,42 7,45 7,60 -0,15 6 46600 1598 120 190 10,9 5,3 9,6 0,41 7,85 7,80 0,05 7 55980 1368 120 195 9,4 5,4 8,6 0,41 8,2 8,06 0,14 8 93169 1956 160 218 9,5 4,7 7,7 0,41 7,75 7,26 0,49 9 33908 1598 124 190 10,9 5,1 8,8 0,39 7,95 7,81 0,14 10 23900 1086 69 156 15 4,1 5,8 0,28 7,75 7,70 0,05 11 27516 1206 81 164 12,1 4,2 6,6 0,31 7,65 7,91 -0,26 12 37175 1368 120 197 9,6 5,5 8,6 0,40 7,35 8,09 -0,74 13 57730 1598 156 204 10,9 5,4 8,8 0,42 7,45 7,84 -0,39 14 33900 1396 108 185 11,5 4,8 7,8 0,36 7,8 7,79 0,01 15 48163 1398 140 202 9,9 4,7 7,8 0,37 7,45 7,97 -0,52 16 55000 1598 120 203 11,5 4,6 9 0,39 7,4 7,38 0,02 17 39800 1197 105 187 10,9 4,9 7,1 0,34 8,1 8,03 0,07 18 29282 1240 80 167 13,5 5,1 7,4 0,35 7,35 7,76 -0,41 19 61700 1390 122 205 10,3 5,2 7,3 0,38 7,65 7,72 -0,07 20 29904 1368 77 165 13,2 5 7,5 0,36 7,6 7,61 -0,01 21 39100 1582 90 172 13,8 4,2 5,7 0,29 7,9 7,28 0,62 22 23990 1248 74 170 16 4 6,4 0,26 7,4 7,35 0,05 23 48900 1364 90 175 11,9 4,0 5,6 0,29 8,1 7,62 0,48 24 42600 1598 90 180 11,5 3,7 5,2 0,26 7,5 7,39 0,11 25 59700 1560 112 190 12,8 4,5 6,4 0,32 7,55 7,36 0,19 26 44170 1598 105 190 11,8 3,9 5,7 0,29 7,9 7,33 0,57 27 56850 1461 110 182 12,5 4,4 6,1 0,31 7,2 7,59 -0,39 28 61578 1598 105 185 11,3 3,7 5,5 0,28 8,2 7,42 0,78 29 55300 1598 105 190 11,7 4,2 5,6 0,29 7,95 7,37 0,58 30 44600 1595 102 188 11,3 5,5 8,8 0,37 7,75 7,74 0,01 31 37200 1598 90 178 11,8 3,6 5,1 0,26 7,3 7,33 -0,03 32 39430 1560 90 173 13,4 4,1 6,1 0,28 7,25 7,37 -0,12 33 39300 1598 110 183 11,7 5,3 8,8 0,36 7,8 7,83 -0,03 34 56019 1248 95 170 14,7 3,6 5,1 0,25 7,45 7,52 -0,07 35 37050 1598 110 185 11,7 5,3 8,8 0,36 7,2 7,80 -0,60 36 48700 1461 105 185 10,9 4 5,5 0,28 7,2 7,69 -0,49 37 80600 1598 200 237 7,5 5,6 9,1 0,43 8,25 8,21 0,04 38 72649,6 1390 160 218 8 5,4 8,7 0,43 8,15 8,17 -0,02 39 49600 1560 156 214 7,3 5,1 9,4 0,41 7,85 8,22 -0,37 40 39970 1197 105 175 11,8 5,9 7,9 0,39 7,85 8,21 -0,36 41 47750 1598 120 195 11,6 5,6 9,8 0,44 7,65 7,62 0,03 42 34400 1598 105 160 12,8 7 10,4 0,48 8,1 8,06 0,04 43 75900 1987 158 185 11 6,5 9,6 0,53 7,7 7,66 0,04 44 28370 1198 70 158 15,9 5,5 8,7 0,39 7,7 7,60 0,10

45 42750 1591 125 178 12,2 5,8 9 0,41 7,9 7,94 -0,04

54

1

1' 0.033

i iN

i i

Y YAPE

N Y

∧

=


Bu tabloda, 0β , 1β , 2β , 3β , 4β , 5β , 6β , 7β , 8β için bulunan 0b , 1b , 2b , 3b ,

4b , 5b , 6b , 7b , 8b istatistikleri kullanılarak 0 0: 0H β = , 0 1: 0H β = , 0 2: 0H β = ,


için sınama sonuçları görülmektedir. 0 0: 0H β = , 0 2: 0H β = , 0 5: 0H β = ve

0 8: 0H β = hipotezleri için elde edilen t değerleri dışında diğer hipotezler için elde

edilen t değerleri %5’den büyük çıkmıştır. Sonuç olarak 0 0: 0H β = , 0 2: 0H β = ,

0 5: 0H β = ve 0 8: 0H β = hipotezleri %95 güven düzeyinde reddedilmiş, hesaplanan

istatistiklerin sıfır olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven

düzeyinde reddedilememiş, hesaplanan istatistiklerin sıfır olduğu belirlenmiştir.

55

Bağımlı değişken üzerinde anlamlı bir etkisi bulunmayan 1X , 3X , 4X , 6X ,

7X değişenleri modelden çıkarıldığında elde edilen sonuç aşağıdaki gibidir.

Bu tabloda, 0β , 2β , 5β , 8β için bulunan 0b , 2b , 5b , 8b istatistikleri

kullanılarak 0 0: 0H β = , 0 2: 0H β = , 0 5: 0H β = , 0 8: 0H β = hipotezleri için sınama

sonuçları görülmektedir. 0 0: 0H β = hipotezi için elde edilen t değeri dışında diğer

hipotezler için elde edilen t değerleri %5’den büyük çıkmıştır. Sonuç olarak

0 0: 0H β = , hipotezi %95 güven düzeyinde reddedilmiş, hesaplanan istatistiğin sıfır

olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven düzeyinde reddedilememiş,

hesaplanan istatistiklerin sıfır olduğu belirlenmiştir. LTS’ye dayalı yeniden

ağırlıklandırılmış EKK Yöntemi (RLS) ile anlamlı bir model kurulamamıştır.

56

3.3. Fuzzy Regresyon Analizi

3.3.1. Tanaka Modeli Uygulaması

Bu analizde, veri seti üzerine, Bölüm 2.3.3.1. ‘de açıklanan Tanaka Yöntemi

hem Kesin Y değerleri için hem de Fuzzy (Bulanık) ( , )Y s değerleri için uygulanmıştır.

Çalışmada Lingo programı kullanılmış ve aşağıdaki sonuçlar bulunmuştur.

0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 1,2,...,45iY A A X A X A X A X A X A X A X A X i= + + + + + + + + =∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼

0 0 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 7 8 8 8( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , )

iY m s m s X m s X m s X m s X m s X m s X m s X m s X= + + + + + + + +∼

1,2,...,45i=

Tablo 4: Kesin ve Fuzzy Y için ( , )j jm s ’ler

0.5 için h =

Kesin Y için ( , )j jm s Fuzzy Y için ( , )j jm s

0

1

5

6

(7.36, 0)

(0, 0.24 04)

(0.0165, 0)

(0.01614, 0)

A

E A

A

A

⇒

− ⇒

⇒

⇒

0

1

2

5

6

(6.342, 0)

(0, 0.3801 04)

(0.6985 04, 0)

(0.0685, 0)

(0.04496, 0)

A

E A

E A

A

A

⇒

− ⇒

− ⇒

⇒

⇒

.

Tabloya baktığımızda Kesin Y değerleri ile kurulan modelde

2 3 4 7 8, , , ,X X X X X değişkenlerinin modelde olmadığı görülmektedir. Fuzzy Y değerleri

ile kurulan modelde ise 3 4 7 8, , ,X X X X değişkenlerinin modelde olmadığı

görülmektedir. Y değerlerini fuzzy olarak ele aldığımızda 2X değişkeninin modele dahil

olduğunu görmekteyiz. Kurulan modeller:

Kesin Y için: ~

1 5 6(7.36, 0) (0, 0.24 04) (0.0165, 0) (0.01614, 0)iY E X X X= + − + +

Fuzzy Y için: ~

1 2 5 6(6.342, 0) (0, 0.3801 04) (0.6985 04, 0) (0.0685, 0) (0.04496, 0)iY E X E X X X= + − + − + +

57

Tablo 5: Kesin ve Fuzzy Y Đçin Tahmini Değerler (Y*), FR1 FR2 Đstatistikleri

Kesin Y için; Fuzzy Y için; .

Y Y* s* FR1 FR2 Y s Y* s* FR1 FR2

7,35 7,56 1,39 0,03 0,19 7,35 0,35 7,19 2,20 0,02 0,30 8,1 7,65 1,07 0,06 0,13 8,1 0,2 7,51 1,70 0,07 0,21 6,45 7,61 2,31 0,18 0,36 6,45 1,85 7,35 3,66 0,14 0,57 7,55 7,58 1,46 0,00 0,19 7,55 0,25 7,25 2,31 0,04 0,31 7,45 7,65 0,68 0,03 0,09 7,45 0,25 7,52 1,07 0,01 0,14 7,85 7,63 1,12 0,03 0,14 7,85 0,35 7,44 1,77 0,05 0,23 8,2 7,60 1,34 0,07 0,16 8,2 0,1 7,32 2,13 0,11 0,26 7,75 7,59 2,24 0,02 0,29 7,75 0,15 7,34 3,54 0,05 0,46 7,95 7,62 0,81 0,04 0,10 7,95 0,25 7,43 1,29 0,07 0,16 7,75 7,67 0,57 0,01 0,07 7,75 0,25 7,63 0,91 0,02 0,12 7,65 7,63 0,66 0,00 0,09 7,65 0,35 7,44 1,05 0,03 0,14 7,35 7,61 0,89 0,03 0,12 7,35 0,15 7,34 1,41 0,00 0,19 7,45 7,63 1,39 0,02 0,19 7,45 0,05 7,44 2,19 0,00 0,29 7,8 7,63 0,81 0,02 0,10 7,8 0,2 7,44 1,29 0,05 0,17 7,45 7,60 1,16 0,02 0,16 7,45 0,15 7,33 1,83 0,02 0,25 7,4 7,62 1,32 0,03 0,18 7,4 0,3 7,45 2,09 0,01 0,28 8,1 7,62 0,96 0,06 0,12 8,1 0,1 7,39 1,51 0,09 0,19 7,35 7,67 0,70 0,04 0,10 7,35 0,35 7,58 1,11 0,03 0,15 7,65 7,61 1,48 0,00 0,19 7,65 0,15 7,38 2,35 0,04 0,31 7,6 7,66 0,72 0,01 0,09 7,6 0,1 7,57 1,14 0,00 0,15 7,9 7,66 0,94 0,03 0,12 7,9 0,2 7,59 1,49 0,04 0,19 7,4 7,69 0,58 0,04 0,08 7,4 0,3 7,71 0,91 0,04 0,12 8,1 7,62 1,17 0,06 0,14 8,1 0,2 7,43 1,86 0,08 0,23 7,5 7,61 1,02 0,01 0,14 7,5 0,2 7,41 1,62 0,01 0,22 7,55 7,64 1,43 0,01 0,19 7,55 0,05 7,53 2,27 0,00 0,30 7,9 7,62 1,06 0,04 0,13 7,9 0,1 7,44 1,68 0,06 0,21 7,2 7,64 1,36 0,06 0,19 7,2 0,1 7,50 2,16 0,04 0,30 8,2 7,61 1,48 0,07 0,18 8,2 0,1 7,39 2,34 0,10 0,29 7,95 7,62 1,33 0,04 0,17 7,95 0,15 7,44 2,10 0,06 0,26 7,75 7,64 1,07 0,01 0,14 7,75 0,25 7,47 1,70 0,04 0,22 7,3 7,61 0,89 0,04 0,12 7,3 0,1 7,42 1,41 0,02 0,19 7,25 7,65 0,95 0,05 0,13 7,25 0,25 7,55 1,50 0,04 0,21 7,8 7,64 0,94 0,02 0,12 7,8 0,2 7,49 1,49 0,04 0,19 7,45 7,66 1,34 0,03 0,18 7,45 0,15 7,60 2,13 0,02 0,29 7,2 7,64 0,89 0,06 0,12 7,2 0,1 7,49 1,41 0,04 0,20 7,2 7,60 1,17 0,06 0,16 7,2 0,1 7,37 1,85 0,02 0,26 8,25 7,57 1,93 0,08 0,23 8,25 0,25 7,22 3,06 0,12 0,37 8,15 7,58 1,74 0,07 0,21 8,15 0,35 7,23 2,76 0,11 0,34 7,85 7,56 1,19 0,04 0,15 7,85 0,35 7,18 1,89 0,09 0,24 7,85 7,65 0,96 0,03 0,12 7,85 0,15 7,50 1,52 0,04 0,19 7,65 7,64 1,15 0,00 0,15 7,65 0,25 7,50 1,81 0,02 0,24 8,1 7,68 0,83 0,05 0,10 8,1 0,4 7,65 1,31 0,06 0,16 7,7 7,65 1,82 0,01 0,24 7,7 0,3 7,53 2,88 0,02 0,37 7,7 7,71 0,68 0,00 0,09 7,7 0,2 7,76 1,08 0,01 0,14

7,9 7,65 1,03 0,03 0,13 7,9 0,2 7,55 1,62 0,04 0,21

58

Kesin Y için: 1

1' 0.037

i iN

i i

Y YAPE

N Y

∧

=

−= ≅∑ ,

Fuzzy Y için: 1

1' 0.045

i iN

i i

Y YAPE

N Y

∧

=


Kesin Y için üyelik fonksiyonları;

0

0

0

1, =7,36 ( )

0, . .A

aa

ö dµ

=

∼ (3.5)

1

11

1

1 , - 0.24 - 04 0.24 04( ) 0.24 04

0 , . .A

aE a E

a Eö d

µ

− < < −= −

∼ (3.6)

5

5

5

1, 0.0165( )

0, . .A

aa

ö dµ

==

∼ (3.9)

6

6

6

1, 0.01614( )

0, . .A

aa

ö dµ

==

∼ (3.10)

1 , ( )

0 , . .

i

i i

i ii i i iYi

Y YY s Y Y sY

s

ö d

µ

∧

∧ ∧∧

− − − < < +=

(3.11)

olarak hesaplanmıştır.

59

Fuzzy Y için üyelik fonksiyonları;

0

20

1, 6.342( )

0, . .A

aa

ö dµ

==

∼ (3.12)

1

11

1

1 , - 0.3801 - 04 0.3801 04( ) 0.3801 04

0 , . .A

aE a E

a Eö d

µ

− < < −= −

∼ (3.13)

2

22

1, 0.6985 04( )

0, . .A

a Ea

ö dµ

= −=

∼ (3.14)

5

5

5

1, 0.0685( )

0, . .A

aa

ö dµ

==

∼ (3.15)

6

6

6

1, 0.04496( )

0, . .A

aa

ö dµ

==

∼ (3.16)

1 , ( )

0 , . .

i

i i

i ii i i iYi

Y YY s Y Y sY

s

ö d

µ

∧

∧ ∧∧

− − − < < +=

(3.18)

olarak hesaplanmıştır.

60

3.3.2. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı Uygulaması

Bu analizde, veri seti üzerine, Bölüm 2.3.7. ‘de açıklanan Fuzzy Lineer

Regresyon Analizine EKK Yaklaşımı Yöntemi uygulanmıştır. Çalışmada SAS/IML

programı kullanılmış ve aşağıdaki sonuçlar bulunmuştur.

( , )Y m s= , * * *( , )Y m s= (3.19)

cε+*m = m , *m = Xa (regresyon denklemi), (3.20)

rε+*s = s , b d+* *s = m 1 (yayılım regresyon denklemi) olmak üzere, (3.21)

* * 2 * 2( , ) ( ) ( )i i i i i i iY Y c c r rδ δ≡ = − + − ’dir. (3.22)

Amaç fonksiyonu şu şekilde tanımlanabilir:

2 * * * *

1

min ( ) '( ) ( ) '( )n

ii

c c c c r r r rδ=

= − − + − −∑ . (3.23)

Analizin sonucunda kestirilen katsayılar şunlardır:

Tablo 6: Kestirilen ja , b ve d

ja

0

1

2

3

4

5

6

7

8

10.34168

3.354 6

0.0000374

0.0083946

0.012231

0.066096

0.2118132

0.0222

3.653391

a

E a

a

a

a

a

a

a

a

⇒

− − ⇒

⇒

⇒

− ⇒

− ⇒

⇒

− ⇒

− ⇒

0.990758b = − , 7.8380299d = .

: 65086Đterasyon sayısı

.

61

Tablo 7: m , *m ve s , *s Değerleri

( , )Y m s= , * * *( , )Y m s=

m m* s s*

7,35 7,63 0,35 0,28 8,1 7,71 0,2 0,20 6,45 6,99 1,85 0,91 7,55 7,35 0,25 0,55 7,45 7,47 0,25 0,44 7,85 7,62 0,35 0,29 8,2 7,66 0,1 0,25 7,75 7,48 0,15 0,43 7,95 7,74 0,25 0,17 7,75 7,70 0,25 0,21 7,65 7,78 0,35 0,13 7,35 7,74 0,15 0,17 7,45 7,72 0,05 0,19 7,8 7,69 0,2 0,22 7,45 7,75 0,15 0,16 7,4 7,33 0,3 0,57 8,1 7,76 0,1 0,14 7,35 7,66 0,35 0,24 7,65 7,57 0,15 0,33 7,6 7,63 0,1 0,28 7,9 7,71 0,2 0,20 7,4 7,55 0,3 0,36 8,1 7,72 0,2 0,19 7,5 7,77 0,2 0,14 7,55 7,61 0,05 0,30 7,9 7,67 0,1 0,24 7,2 7,74 0,1 0,17 8,2 7,71 0,1 0,20 7,95 7,71 0,15 0,20 7,75 7,68 0,25 0,23 7,3 7,77 0,1 0,14 7,25 7,73 0,25 0,18 7,8 7,79 0,2 0,12 7,45 7,68 0,15 0,23 7,2 7,78 0,1 0,13 7,2 7,83 0,1 0,08 8,25 7,83 0,25 0,08 8,15 7,68 0,35 0,23 7,85 7,82 0,35 0,09 7,85 7,86 0,15 0,05 7,65 7,46 0,25 0,45 8,1 7,86 0,4 0,05 7,7 7,73 0,3 0,18 7,7 7,44 0,2 0,46

7,9 7,85 0,2 0,06

62

1

1' 0.0335

i iN

i i

Y YAPE

N Y

∧

=


3.4. Fuzzy Robust Regresyon Analizi

Bu bölümde veri seti, Bölüm 2.4.1.’de açıklanan M-Kestiricisi’ne Dayanan

Fuzzy Robust Regresyon Analizi Yöntemi ile hem Kesin Y değerleri için hem de Fuzzy

Y değerleri için Fuzzy Robust Regresyon Analizi’ne tabi tutulmuştur. Fuzzy Y değerleri

ile yapılan analizde uygun bir sonuç bulunamamıştır. Analiz Lingo programı ile

yapılmış ve aşağıdaki sonuçlar bulunmuştur.

0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8iY A A X A X A X A X A X A X A X A X= + + + + + + + +∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼

(3.24)

01 02 03 11 12 13 1 21 22 23 2 81 82 83 8( , , ) ( , ) ( , ) ... ( , )iY a a a a a a X a a a X a a a X= + + + +∼

(3.25)

Tablo 8: Kesin Y için 1 2 3( , , )j j ja a a ’ler

0 için h =

Kesin Y için 1 2 3( , , )j j ja a a :

0

1

2

3

4

5

6

7

8

(0, 0, 0)

(0.928 04, 0.943 04, 0.943 04)

(0, 0.127 03, 0.127 03)

(0, 0, 0)

(0, 0.406 02, 0.406 02)

(0, 0, 0)

(0.234, 0.234, 0.234)

(0, 0, 0)

(7.972, 7.972, 7.972)

A

E E E A

E E A

A

E E A

A

A

A

A

⇒

− − − ⇒

− − ⇒

⇒

− − ⇒

⇒

⇒

⇒

⇒

.

63

Tablo 9: 2 3 5 6, , ,A A A A Analizden Çıkartıldığında

Kesin Y için 1 2 3( , , )j j ja a a ’ler

0 için h =

Kesin Y için 1 2 3( , , )j j ja a a :

1

2

4

6

8

(0.928 04, 0.943 04, 0.943 04)

(0, 0.127 03, 0.127 03)

(0, 0.406 02, 0.406 02)

(0.234, 0.234, 0.234)

(7.972, 7.972, 7.972)

E E E A

E E A

E E A

A

A

− − − ⇒

− − ⇒

− − ⇒

⇒

⇒

.

Oluşturulan model:

Kesin Y için:

1 2

4 7

8

(0.928 04,0.943 04,0.943 04) (0,0.127 03,0.127 03)

(0,0.406 02,0.406 02) (0.234,0.234,0.234)

(7.972,7.972,7.972)

iY E E E X E E X

E E X X

X

= − − − + − −

+ − − +

+

∼

(3.26)

’dir.

64

Üyelik fonksiyonları:

1

1 , 0.928 04( )

0 , .A

a Ea

ö dµ

= −=

(3.27)

2

, 0 0.127 03( ) 0.127 03

0 , . .A

aa E

a Eö d

µ ≤ ≤ −

= −

(3.28)

4

, 0 0.406 02( ) 0.406 02

0 , . .A

aa E

a Eö d

µ ≤ ≤ −

= −

(3.29)

6

1 , 0.234( )

0 , .A

aa

ö dµ

==

(3.30)

8

1 , 7.972( )

0 , .A

aa

ö dµ

==

(3.31)

*

1 6 8

2

1 2 4

0 , 0.928 04 0.234 7.972

8.211 , 0 0.127 03 0

0.15 05 0.127 03 0.406 02( )i

i i i

i

i i iY

y E x x x

yy E x

E x E x E xyµ

< − + +

−− ≤ ≤+ − +

− + − + −=4

1 2

.406 02

0 , 0.943 04 0.127 03

i

i i

E x

y E x E x

−

> − + −

4 6 8 0.406 02 0.234 7.972i i iE x x x+ − + +

(3.32)

65

Tablo 10: Gözlenen Y ve Tahmin Edilen Y* Değerleri

Y Y*min Y* Y*max

7,35 9,7 10,8 10,8 8,1 8,9 9,9 9,9 6,45 14,5 15,7 15,7 7,55 10,1 11,2 11,2 7,45 7,2 8,1 8,1 7,85 8,9 9,9 9,9 8,2 9,7 10,8 10,8 7,75 13,0 14,3 14,3 7,95 7,4 8,5 8,5 7,75 5,4 6,2 6,2 7,65 6,0 6,9 6,9 7,35 7,9 8,9 8,9 7,45 10,0 11,1 11,1 7,8 7,2 8,1 8,1 7,45 8,6 9,6 9,6 7,4 9,3 10,4 10,4 8,1 7,5 8,5 8,5 7,35 6,7 7,6 7,6 7,65 10,0 11,1 11,1 7,6 6,8 7,7 7,7 7,9 6,9 7,9 7,9 7,4 5,2 6,1 6,1 8,1 7,8 8,7 8,7 7,5 6,9 7,9 7,9 7,55 9,2 10,2 10,2 7,9 7,3 8,3 8,3 7,2 8,8 9,8 9,8 8,2 8,8 9,8 9,8 7,95 8,4 9,5 9,5 7,75 8,4 9,4 9,4 7,3 6,4 7,4 7,4 7,25 6,9 7,8 7,8 7,8 7,8 8,8 8,8 7,45 8,1 9,0 9,0 7,2 7,6 8,6 8,6 7,2 7,6 8,7 8,7 8,25 12,3 13,5 13,5 8,15 11,4 12,6 12,6 7,85 9,1 10,2 10,2 7,85 8,2 9,1 9,1 7,65 9,2 10,3 10,3 8,1 8,7 9,6 9,6 7,7 12,8 13,9 13,9 7,7 7,0 7,9 7,9

7,9 8,6 9,6 9,6

66

Y*

0,0

2,0

4,0

6,0

8,0

10,0

12,0

14,0

16,0

18,0

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45

Y*

Şekil 3.1. Tahmin Edilen Y*’ların Görünümü

Y* değerlerini küçükten büyüğe doğru sıraladıktan sonra 1. ve 3. kartil

değerleri:

1

3

1 45 111.5 ' 8.1

4 43 1 3x45 1

34' 10.34 4

nQ uncu gözlem değeri

nQ üncü gözlem değeri

+ += = = =

+ += = = =

olarak hesaplanır. Bu değerlerden hareketle,

3 1( ) 10.3 8.1 2.2mjIQR r Q Q= − = − =

olarak bulunur. Sınırı aşan değerler için puanlama yöntemi,

1 31.5 x ( ) 4.8 veya 1.5 x ( ) 13.6 mj mjQ IQR r Q IQR r− = + =

şeklinde olacaktır. 4.8 değerinden daha düşük veya 13.6 değerinden daha büyük

değerler düzensiz çıktı verisi olarak adlandırılır. Şekil 3.1’e veya Tablo 10’a

baktığımızda, 15.7 değeriyle 3. tahmin değerinin, 14.3 değeriyle 8. tahmin değerinin ve

67

13.9 değeriyle 43. tahmin değerinin 13.6 değerini aştığını görmekteyiz. Bu tahmin

değerlerinin düzensiz çıktı verisi olduğunu söyleyebiliriz. Bu değerler,

i mi mim

i mi

y y rh

y y

−= =

işlemi ile elde edilen miy değeriyle değiştirilir.

Keyfi bir değer olan 0.45mh = için 3 9.35my = , 8 10.24my = ve 43 11.17my =

olarak hesaplanmıştır. Elde edilen son grafik:

Y*

0,0

2,0

4,0

6,0

8,0

10,0

12,0

14,0

16,0

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45

Y*

Şekil 3.2. 3 8 43, ,m m my y y ile Birlikte Tahmin Edilen Y*’ların Görünümü

şeklindedir.

68

1

1' 0.23

i iN

i i

Y YAPE

N Y

∧

=


3.5. Karşılaştırma

Tablo 11: Dört Tekniğin Karşılaştırması

Regresyon Robust Regresyon Fuzzy Regresyon Fuzzy Robust Regresyon

LMS - RLS LTS - RLS Tanaka Đteratif EKK M Yöntemi

---- 0,038 - ---- 0,033 - ----

Kesin Y 0,037

Fuzzy Y 0.045 0,0335 0,23

---- 0,52 - ---- 0,79 - ---- ---- ---- ----

Tabloda görüldüğü üzere, Regresyon Analizi sonucunda anlamlı bir model

kurulamadığından 'APE ve 2R değerleri hesaplanamamıştır. LMS Yöntemi ile yapılan

Robust Regresyon Analizi sonucunda 'APE değeri ' 0.038APE = , 2R değeri

2 0.52R = olarak hesaplanmış, LMS’ye dayalı yeniden ağırlıklandırılmış EKK

Yöntemi’nde (RLS) anlamlı bir model kurulamadığından 'APE ve 2R değerleri

hesaplanamamıştır. Tanaka Modeli’nde Kesin Y girdi değerleri ile yapılan Fuzzy

Regresyon Analizi sonucunda 'APE değeri ' 0.037APE = olarak hesaplanmıştır.

Fuzzy Y girdi değerleri ile yapılan Analizde ise, 'APE değeri ' 0.045APE = olarak

hesaplanmıştır. Đteratif EKK Yaklaşımı ile yapılan Fuzzy Regresyon Analizi sonucunda

'APE değeri ' 0.0335APE = olarak hesaplanmıştır. M Yöntemine dayanan Fuzzy

Robust Regresyon Analizi sonucunda 'APE değeri ise ' 0.23APE = olarak

hesaplanmıştır.

'APE

2R

69

4. SONUÇ ve BULGULAR

Regresyon Analizi işletme, finans, ekonomi, ekonometri, tip, kimya, biyoloji

gibi çeşitli bilim alanlarında yoğun olarak kullanılmaktadır. Regresyon Analizi’nin

temelinde gözlenen bir olayın hangi olayların etkisi altında olduğunu araştırmak

yatmaktadır. Diğer bir ifade ile “Gözlenen bağımlı değişken hangi bağımsız değişken ya

da değişkenler tarafından ifade edilmektedir?” sorusuna yanıt aramaktır. Bu ilişki bir

model yardımı ile kurulmaktadır. Bu modelin adına regresyon modeli denilmektedir.

Robust Regresyon Analizi, Klasik Regresyon Analizi için gereken

varsayımların sağlanmadığı durumlarda, veri setinde aykırı değer ve/veya uç değer

olması durumlarında tercih edilen bir yöntemdir. Özellikle açıklanan değişkenin normal

dağılmadığı durumlarda başvurulan bir yöntemdir. Gerçek hayat verilerinde, özellikle

sosyal verilerde Klasik Regresyon Analizi için gereken varsayımların sağlanmadığı

görülebilmekte ve veri setinde aykırı ve/veya uç değer olabilmektedir. Böyle

durumlarda robust yöntemler tercih edilmekte ve Klasik Regresyon’a göre daha etkin

sonuçlar verdiği görülmektedir.

Fuzzy Regresyon Analizi, Klasik Regresyon’da modele eklenen hata terimiyle

gösterilen belirsizliği, regresyon parametrelerinin bulanıklığında göstermektedir.

Bağımlı değişken ile bağımsız değişken ya da değişkenler arasında kesin bir ilişki

kurulamadığı zaman ya da veri setindeki girdi değişkenlerinin ve/veya çıktı değerlerinin

bulanık olması durumunda tercih edilebilinir. Ek olarak Klasik Regresyon’da olduğu

gibi tek bir doğru ile bağımlı değişkeni açıklamak yerine, Fuzzy Regresyon’da alt ve

üst regresyon doğruları oluşturularak bağımlı değişkendeki toplam değişimi açıklama

oranını yükseltebiliriz. Son yıllarda özellikle finans alanında etkin bir şekilde bu

analizin kullanıldığı görülmektedir. Çeşitli karar mekanizmaları oluşturmak için bu

analizin yararlanılabilmektedir. Fuzzy Regresyon Analizi’nin dayandığı Bulanık Mantık

Kuramı ise günümüzde özellikle elektronikte uygulama alanı bulmaktadır.

Veri setinde aykırı ve/veya uç değerler olması durumunda Fuzzy Regresyon

Analizi ile kurulan modelin bulanıklığı artmaktadır. Bu bulanıklığı azaltmak için robust

yöntemler geliştirilmiş, geliştirilmektedir. Böyle durumlarda Fuzzy Robust Regresyon

70

Analizi tercih edilmektedir. Günümüzde geliştirilen çeşitli robust yaklaşım

algoritmalarıyla bu bulanıklık düşürülmeye çalışılmaktadır. Gerçek yaşam verilerinde

veri setinde aykırı ve/veya uç değerle karşılaşılmaktadır. Böyle durumlarda Fuzzy

Robust Regresyon Analizi’nin Fuzzy Regresyon Analizi’ne göre daha iyi sonuç verdiği

görülmektedir.

Bu tez kapsamında 45 otomobil markası teknik verileriyle otomobil beğeni

fonksiyonu oluşturulmaya çalışılmıştır.

Klasik Regresyon Analizi’nde En Küçük Kareler (EKK) Kestirim Yöntemiyle

kestirilen parametreler t sınamasından geçememiş ve anlamlı bir model

kurulamamıştır. Robust Regresyon Analizi’nde LMS Kestirim Yöntemiyle, 2 0.52R =

ve ' 0.038APE = olan,

1 2 3 4 5 6 7 86.45 1.52 5 8.65 04 0.015 0.00295 0.021 0.413 0.074 2.069Y E X E X X X X X X X∧

= − − − − + + + + − −modeli kurulmuştur. LMS’ye Dayalı Yeniden Ağırlıklandırılmış EKK Yöntemi

(RLS)’nde kestirilen regresyon parametreleri t sınamasından geçemediğinden anlamlı

bir model kurulamamıştır. LTS Kestirim Yöntemiyle, 2 0.79R = ve ' 0.033APE = olan,

1 2 3 4 5 6 7 811.93 3.885 7 9.845 04 0.01 0.0154 0.124 0.218 0.107 3.98Y E X E X X X X X X X∧

= − − − − − − − + + −

modeli kurulmuştur. LTS’ye Dayalı Yeniden Ağırlıklandırılmış EKK Yöntemi

(RLS)’nde kestirilen regresyon parametreleri t sınamasından geçemediğinden anlamlı

bir model kurulamamıştır. Robust Yöntemler Klasik Regresyon’a göre daha iyi sonuç

vermiştir.

Fuzzy Regresyon Analizi’nde Tanaka Modeli Uygulamasında Kesin Y girdi

değerleri ile oluşturulan model,

~

1 5 6(7.36, 0) (0, 0.24 04) (0.0165, 0) (0.01614, 0)iY E X X X= + − + + olup,

' 0.037APE = olarak hesaplanmıştır. Fuzzy Y girdi değerleri ile oluşturulan model ise,

~

1 2 5 6(6.342, 0) (0, 0.3801 04) (0.6985 04, 0) (0.0685, 0) (0.04496, 0)iY E X E X X X= + − + − + + olup,

' 0.045APE = olarak hesaplanmıştır. Đteratif EKK Yöntemi’nde ise 65086 iterasyon

sonucunda parametreler kestirilmiş ve elde edilen tahmini Y değerleri sonucunda 'APE

71

değeri, ' 0.0335APE = olarak hesaplanmıştır. Fuzzy Robust Regresyon Analizi’ne

baktığımızda M Yöntemi’ne Dayanan Fuzzy Robust Regresyon Analizi ile oluşturulan

modelin 'APE değeri, ' 0.23APE = olarak hesaplandığını görmekteyiz. Hem Tanaka

Modeli hem de Đteratif EKK Yöntemi ile yapılan Fuzzy Regresyon Analizi Fuzzy

Robust Regresyon Analizi’ne göre daha iyi sonuç verdiği söylenebilir.

Bu tez kapsamında Çoklu Regresyon Analizi’ne karşı diğer üç tekniğin

(Robust Regresyon Analizi, Fuzzy Regresyon Analizi, Fuzzy Robust Regresyon

Analizi) nasıl sonuç verdiği; tekniklerin birbirlerine karşı bir üstünlüklerinin olup

olmadığı incelenmiştir. Elde edilen sonuçlar, elimizdeki veri setinden yola çıkılarak

elde edilmiştir. Başka bir veri setinde (örneğin aykırı ve/veya uç değerlerin olduğu bir

veri seti) başka sonuçlar elde edilebilinecek, yaptığımız analizde üstün gelmeyen bir

teknik üstün gelebilecektir. Sonuç olarak bu tekniklerin birbirlerine karşı bir

üstünlüklerinin olmadığına, elimizdeki veri setinin yapısına göre her bir tekniğin

birbirine üstün gelebileceği saptanmıştır.

72

EKLER

EK 1. ANALĐZLERDE KULLANILAN OTOMOBĐL MARKALARI

n Marka

1 MINI Cooper 2 Toyota Corolla 1.6 A/T 3 Mercedes-Benz C 180 BlueEfficiency 4 Audi A1 1.4 TFSI S tronic 5 Skodia Fabia 1.4 6 Citroen DS3 1.6 Vti 120 HP 7 Alfa Romeo Giulietta 1.4 TB 8 Opel Insignia 2.0 CDTi 9 Chevrolet Cruze 1.6 10 Hyundai i10 1.1 Team A/T 11 Chevrolet Spark 1.2 LT 12 Fiat Bravo 1.4 T-Jet 13 Citroen C4 1.6 THP MCP 14 Hyundai Accent Blue 1.4 15 Opel Astra 1.4 HB Turbo 16 Peugeot 508 1.6 Vti Auto 6R 17 Seat Leon 1.2 TSI 18 Nissan Micra 1.2 CVT 19 Volkswagen Passat 1.4 TSI DGS 20 Fiat Punto Evo 1.4 Fire 21 Kia cee'd 1.6 CRDi 22 Tata Vista 1.3 CRDi Quadrojet 23 Toyota Corolla 1.4 D-4D 24 Volkswagen Polo 1.6 TDI 25 Citroen C5 1.6 Hdi 26 Skoda Octavia 1.6 TDI 27 Renault Latitude 1.5 dCi 28 Alfa Romeo Giulietta 1.6 JTD-2 29 Volkswagen Jetta 1.6 TDI DSG 30 Volkswagen Golf 1.6 TDI DSG 31 Seat Ibiza Sportourer 1.6 TDI 32 Citroen C3 1.6 Hdi 33 Renault Fluence 1.5 dCi EDC 34 Opel Astra HB 1.3 CDTi 35 Renault Megane HB dCi EDC 36 Renault Megane HB 1.5 dCi 37 Peugeot RCZ 1.6 HP 38 Volkswagen Scirocco 1.4 TSI DGS 39 Citroen DS3 1.6 THP 40 Skoda Yeti 1.2 TSI 41 Peugeot 3008 1.6 VTI 42 Dacia Duster 1.6 4x4 43 Toyota RAV4 2.0 Valvematic CVT 44 Skoda Roomster 1.2

45 Kia Venga 1.6 CVVT A/T

73

KAYNAKLAR

Alpar R., “Uygulamalı Çok Değişkenli Đstatistiksel Yöntemlere Giriş 1”, Nobel Yayın

Dağıtım, 2. Baskı, 2003

Altrock C. V., “Fuzzy Logic and NeuroFuzzy Applications in Business and Finance”,

Prentice Hall PTR, 1997

Andersen R., “Modern Methods for Robust Regression”, SAGE Publications, 2008

Başer F., “Aktüeryal Modellemede Melez Bulanık Regresyon Analizi”, Yüksek Lisans

Tezi, Ankara Üniversitesi, F.B.E., Đstatistik Ana Bilim Dalı, 2007

Bolatin A., “Fuzzy Logic Approach to Robust Regression Models of Uncertain Medical

Categories”, World Academy of Science, Engineering and Technology, 2006,s:106-111

Bolotin A., “Robustness of The Regression Models for Uncertain Categories”,

International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems Vol.15,

No.6 (2007) 681-695 © World Scientific Publishing Company

Buckley J. J., “Fuzzy Probability and Statistic”, Spinder, 2006

Chen C., “Robust Regression and Outlier Detection with The ROBUSTREG

Procedure”, SAS Institute Inc., Cary, NC, s:265-27

Cheng C., Lee E. S., “Fuzzy Regression with Radial Basis Function Network”, Fuzzy

Sets and Syatems 119 (2001), s:291-301

Cheng W. Y., Su E., Li S. J., “A Financial Distress Pre-Warning Study by Fuzzy

Regression Model of TSE-Listed Companies”, Asian Academy of Management Journal

of Accounting and Finance, Vol:2, No:2, 2006, s:75-93

Çağman N., “Bulanık Mantık”, Bilim ve Teknik, Vol:363, 2006, s:50-51, Haziran 2006

Çetin E., “Bulanık Mantık Denetleyiciler”, Seçkin Yayıncılık, 2003

74

D’Urso P., “Linear Regression Analysis for Fuzzy/Crisp Input and Fuzzy/Crisp Output

Data”, Computational Statistics & Data Analysis 42 (2003) 47-72

Davies P. L., “Aspects of Robust Linear Regression”, The Annals of Statistics 1993,

Vol.21, No.4, 1843-1899

Düzyurt S., “Bulanık Regresyon ile Tahmin ve Bir Uygulama”, Yüksek Lisans Tezi,

Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Endüstri Mühendisliği Ana Bilim Dalı,

Haziran 2008, Ankara

Erar A., “Bağlanım (Regreyon) Çözümlemesi, Ders Notları…”, MSGSÜ, Đstatistik,

Eylül 2006

Ergül B. “Robust Regresyon ve Uygulamaları”, Yüksek Lisans Tezi, Eskişehir

Osmangazi Üniversitesi, Fen Bilimleri Enstitüsü, Đstatistik Anabilim Dalı, Uygulamalı

Đstatistik Bilim Dalı, Temmuz 2006

Genceli M., “Ekonometri ve Đstatistik Đlkeleri”, Filiz Kitabevi, 2. Basım, 2001

Güneş M., Umarusman N., “Bir Karar Destek Aracı Bulanık Hedef Programlama ve

Yerel Yönetimlerde Vergi Optimizasyonu Uygulaması”, A Review of Social Economic

& Business Studies, Vol:2, s:242-255

Güneş M., “Bulanık Doğrusal Sistemler ve Regresyon Modellerine Uygulanması”, A

Review of Social Economic & Business Studies, Vol.1, No.1, Fall 2001, s:176-192

Hampel F., “Robust Statistic: A Brief Introduction and Overview”, Seminar für Statistik

Eidgenössische Technische Hochschule (ETH), Research Report No. 94, March 2001,

CH-8092 Zürich, Switzerland

Heikkila J., “Robust Regression”, Graduate Course on Advanced Statistical Signal

Processing, Information Processing Laboratory Department of Electrical Engineering P.

O. Box 4500, 90014 University of Oulu

75

Hellmann M., “Fuzzy Logic Introduction”, Laboratoire Antennes Radar Telecom, F.R.E

CNRS 2272, Equipe Radar Polarimetrie, Universit´e de Rennes 1, UFR S.P.M, Campus

de Beaulieu - Bat. 22, 263 Avenue General Leclerc, CS 74205, 35042 Rennes Cedex,

France

Hoaglin D. C., Mosteller F., Tukey J. W.,”Understanding Robust and Explonatory Data

Analysis”, New York: John Wiley & Sons, 1983

Hojati M., Bector C. R. Smimou K., “A Simple Method for Computation of Fuzzy

Linear Regression”, European Journal of Operational Research, 2004

Đnal H. C., Günay S., “ Olasılık ve Matematiksel Đstatistik”, Hacettepe Üniversitesi Fen

Fakültesi Yayınları, Beşinci Baskı, Ders Kitapları Dizini: 16, 2002

Kadilar C., Candan M., Cingi H., “Ratio Estimators Using Robust Regression”,

Hacettepe Journal of Mathematics and Statistics, Volume 36 (2) , 2007, s:181-188

Kalaycı Ş. “Spss Uygulamalı Çok Değişkenli Đstatistik Teknikleri”, Asil Yayın Dağıtım

Ltd. Şti., ISBN 975-9091-14-13, Birinci Baskı,2005

Kao C., Chyu C. L., “A Fuzzy Linear Regression Model with Beter Explanatory

Power”, Fuzzy Sets and Systems, 2002, s: 401-409

Kayhan Y., “Regresyon Çözümlemesinde Sağlam Konum Kestiricilerinin

Karşılaştırılması”, Yüksek Lisans Tezi, Hacettepe Üniversitesi, F.B.E., Đstatistik Ana

Bilim Dalı, 2006

Li J., Zheng M., “Robust Estimation of Multivariate Regression Model”, Regular

Article, Stat Papers (2009) 50:81-100 DOI 10.10007/s00362-007-0063-6

Maronna R. A., Martin R. D., Yohai V. J., “Robust Statistics : Theory and Methods”,

John Wiley & Sons, 2006

Martin R. D., Yohai V. J., Zamar R. H., “Min-Max Bias Robust Regression”, The

Annals of Statistics 1989, Vol.17 No.4, 1608-1630

76

Nasrabadi E., Hashemi S. M., “Robust Fuzzy Regression Analysis Using Neural

Networks”, International Journal of Uncertainty, Fuzziness and Knowledge-Based

Systems Vol.16, No.4 (2008) 579-598 © World Scientific Publishing Company

Nasrabadi M. M., Nasrabadi E., “ A mathematical-programming approach to Fuzzy

linear regression analysis” Applied Mathematics And Computation, 2004

Oğuzlar A., “Đstatistikel Veri Analizi SPSS ve Minitab Uygulamalı”, Ezgi Kitapevi

Yayınları, 1. Basım, Bursa, 2007

Olive D. J., “Applied Robust Statistics”, Southern Illinois University Department of

Mathematics, Mailcode 4408 Carbondale, IL 62901-4408, June 23, 2008

Önder A. Ö. “Least Median Squares : A Robust Regression Technique”, Ege Akademik

Bakış, Cilt:1, Sayı:1, 2001, s:185-191

Pearson K., Yule U., Blanchard N., Lee A. "The Law of Ancestral Heredity",

Biometrika, 1903

Peters G., “Fuzzy Linear Regression with Fuzzy Đntervals”, Fuzzy Sets and

Systems,1994

Ronchetti E., “Historical Development of Robust Statistics”, University of Geneva,

Switzerland, ICOTS-7, 2006

Rousseeuw P. J., Leroy A. M., “Robust Regression and Outlier Detection”, Jonh

Wiley & Sons, 2003

Rousseeuw P. J., Aelst S. V., Driessen K. V., Agullo J., “Robust Multivariate

Regression”, Technometrics; Aug 2004; 46,3; ABI/INFORM Global pg.293

Sanchez A. J., Gomez A. T., “Applications of Fuzzy Regression in Actuarial Analysis”,

The Journal of Risk and Insurance , 2003, Vol. 70, No. 4, 665-699

Serper Ö., “Uygulamalı Đstatistik II”, Ezgi Kitapevi, 4. Baskı, Kasım 2000

77

Shapiro A. F., “Fuzzy Regression Models”, Smeal College of Business, University Park,

PA 16802, USA

Sohn B. Y., “Robust Fuzzy Linear Regression Based on M-estimators”, J. App1. Math.

& Computing Vol:18, No:1-2, 2005, s:591-601

Şanlı K., Apaydın A., “The Fuzzy Robust Regression Analysis, The Case of Fuzzy Data

Has Outlier” G.Ü. Fen Bilimleri Dergisi, 2004, s:71-84

Şen Z., “Bulanık Mantık ve Modelleme Đlkeleri”, Bilge Kültür Sanat, 2001

Tatlıdil H., “Uygulamalı Çok Değişkenli Đstatistiksel Analiz”, Ziraat Matbaacılık A.Ş.,

Eylül 2002

Tekin N., Armutlulu Đ. H., “Bulanık Doğrusal Regresyonla Bazı Ekonometrik

Değişkenlerin Đncelenmesi ve Reel Efektif Döviz Kurunun Belirlenmesinde Ölçüm

Modeli Denemesi”, Sosyal Bilimler Dergisi, Cilt 1, Sayı:2, s:32-40, Mayıs 1994

Trafalis T. B., Ince Huseyin, “Support Vector Machine for Regression and Applications

to financial Forecasting”, School of Industrial Engineering, University of Oklahoma,

220 W. Boyd, Suite 124, Norman, Oklahoma 73019

Uras Y., “Bulanık Mantığın Doğrusal Regresyon Analizinde Kullanılmasına Đlişkin Bir

Uygulama”, Dokuz Eylül Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri Ana

Bilim Dalı, 1998, Đzmir

Vinod H. D., Ulah A., “Recent Advances in Regression Methods”, New York: Marcel

Dekker, 1981

Vural A., “Aykırı Değerlerin Regresyon Modellerine Etkileri ve Sağlam Kestiriciler”,

Yüksek Lisans Tezi, Marmara Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2007

Wang H. F., Tsaur R. C., “Resolution of Fuzzy regression model”, European Journal of

Operational Research, 2000, s:637-650

78

Watada J., Yabuuchi Y., “Fuzzy Robust Regression Analysis”, Department of Industrial

Management, Osaka Institute of Technology, 5-16-1 Omiya, Asahi, Osaka 535 Japan,

0-7803-1896-X/94 1994 IEEE

Wilcox R. R, “Fundamentals of Modern Statistical Methods, Substantially Improving

Power and Accuracy” Book Chapter 11: Robust Regression

Wieser A., Brunner F. K., “Robust Estimation Applied to Correlated GPS Phase

Observations”, Engineering Surveying and Metrology, Graz University of Technology,

Steyrergasse 30, 8010 Graz, Austria

Xu H., Caramanis C., Mannor S., “Robust Regression and Lasso”, IEEE Transactions

on Information Theory, Vol.56, No.7, July 2010

Yaffee R. A., “Robust Regression Analysis : Some Popular Statistical Package

Options”, Statistics Social Science, and Mapping Group Academic Computing Services,

Information Technology Services, December 2002

Yang M. S., Liu H. H., “Fuzzy Least-Squares Algorithms for Interactive Fuzzy Linear

Regression Models”, Fuzzy Sets and Systems 135 (2003) 305-316

Yorulmaz Ö., “Dayanıklı Regresyon Yöntemi ve Çeşitli Sosyal Veriler Üzerinde Aykırı

Gözlemlerin Teşhisi”, Balıkesir Üniversitesi, Sosyal Bilimler Enstitüsü Dergisi, Cilt:12,

Sayı 21, Haziran 2009, s:76-88

Yücel L. Đ., “Bulanık Regresyon : Türkiye’de 1980-2004 Döneminde Kayıt Dışı

Ekonominin Bulanık Yöntemlerle Tahminine Đlişkin Bir Uygulama”, Yüksek Lisans

Tezi, Đstanbul Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2005

Zadeh L. A., “Fuzzy Locig=Computing With Words”, IEEE Transactions on Fuzzy

Systems, 1996

FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA · 2011-11-21 · t.c. marmara ÜnĐversĐtesĐ sosyal...

Documents

Transcript of FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA · 2011-11-21 · t.c. marmara ÜnĐversĐtesĐ sosyal...