FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA · 2011-11-21 · t.c. marmara ÜnĐversĐtesĐ sosyal...
Transcript of FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA · 2011-11-21 · t.c. marmara ÜnĐversĐtesĐ sosyal...
T.C. MARMARA ÜNĐVERSĐTESĐ
SOSYAL BĐLĐMLER ENSTĐTÜSÜ ĐŞLETME ANABĐLĐM DALI
SAYISAL YÖNTEMLER BĐLĐM DALI
FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA
Yüksek Lisans Tezi
MURAT YAZICI
Đstanbul, 2011
T.C. MARMARA ÜNĐVERSĐTESĐ
SOSYAL BĐLĐMLER ENSTĐTÜSÜ ĐŞLETME ANABĐLĐM DALI
SAYISAL YÖNTEMLER BĐLĐM DALI
FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA
Yüksek Lisans Tezi
MURAT YAZICI
Danışman: Prof. Dr. Đsmail Hakkı ARMUTLULU
Đstanbul, 2011
i
GENEL BĐLGĐLER
Đsim ve Soyadı : Murat YAZICI
Anabilim Dalı : Đşletme
Programı : Sayısal Yöntemler
Tez Danışmanı : Prof. Dr. Đsmail Hakkı ARMUTLULU
Tez Türü ve Tarihi: Yüksek Lisans – Kasım 2011
Anahtar Kelimeler: Fuzzy Robust Regresyon, Fuzzy Regresyon, Robust Regresyon,
Çoklu Doğrusal Regresyon, Otomobil, Otomobil Beğeni Fonksiyonu
ÖZET
FUZZY ROBUST REGRESYON ĐLE BĐR UYGULAMA
Regresyon analizinde veri setini analiz etmek oldukça önemlidir. Çünkü tek bir
gözlem bile regresyon modelindeki parametre kestirimleri üzerinde büyük bir etkiye
sahip olabilir. Aykırı ya da uç değerlerin veriden çıkartılması zamanında önerilse de bu
regresyon denklemini tamamen değiştirebilir. Bu nedenle, veri setinde aykırı ya da uç
değer olması durumunda non-parametrik yöntemlerden olan robust yöntemler
önerilmiştir. Robust yöntemlerin aykırı ya da uç değer olması durumunda klasik
regresyona göre daha iyi sonuçlar verdiği görülmektedir.
Bu çalışmada EKK yöntemine dayanan Klasik Regresyon Analizi, Robust
Regresyon Analizi, Fuzzy Regresyon Analizi ve Fuzzy Robust Regresyon Analizi
incelenmiştir. Sonrasında 45 otomobil markasının teknik verileriyle yukarıda bahsi
geçen her bir analiz uygulanmış ve sonuçlar karşılaştırılmıştır.
ii
GENERAL KNOWLEDGE
Name and Surname : Murat YAZICI
Field : Business Administration
Programme : Quantitative Methods
Supervisor : Đsmail Hakkı ARMUTLULU
Degree Awarded and Date: Master – November 2011
Keywords : Fuzzy Robust Regression, Fuzzy Regression,
Robust Regression, Multiple Linear Regression,
Automobile, Automobile Rating Function
ABSTRACT
FUZZY ROBUST REGRESSION WITH AN APPLICATION
In regression analysis, data analysis is very important. Because, even one
observation may be large effect over parameters estimates in regression model. Outliers
or extreme values are removed from the data is recommended at the time of this
regression equation can change completely. Therefore, the data set to be contrary to the
case of extreme or outlier value, robust methods which are non-parametric methods are
proposed. Robust methods are given beter results than classical regression if data set
includes extreme or outlier values.
In this study, based on the classical method of EKK Regression Analysis,
Robust Regression Analysis, Fuzzy Regression Analysis and Fuzzy Robust Regression
Analysis were examined. After, with technical data of 45 automobile brands, each
analysis of above mentioned were applied and results were compared.
iii
ĐÇĐNDEKĐLER
ÖZET………………………………………………………………………………… i
ABSTRACT………………………………………………………………………….. ii
ĐÇĐNDEKĐLER……………………………………………………………………… iii
TABLO DĐZĐNĐ……………………………………………………………………... vii
ŞEKĐL DĐZĐNĐ………………………………………………………………………. viii
1. GĐRĐŞ……………………………………………………………………………… 1
2. ÇOKLU DOĞRUSAL REGRESYON, ROBUST REGRESYON, FUZZY
REGRESYON VE FUZZY ROBUST REGRESYON………………...………….. 3
2.1. Çoklu Doğrusal Regresyon Analizi………………………….......…..…………... 3
2.1.1. Çoklu Doğrusal Regresyon Denklemi ve Varsayımı…..……………….. 3
2.1.2. Çoklu Doğrusal Regresyonda En Küçük Kareler (EKK) Kestirimi……. 4
2.1.3. Anlamlılık Testleri……………………………………….….………….. 5
2.1.3.1. Tümel-F Testi (Varyans Çözümlemesi)…………….………… 6
2.1.3.2. T-Testi………………….………………….………………..... 7
2.1.4. EKK Kestiricisi’nin Etkin Olmadığı Durumlar………………………... 8
2.2. Robust Regresyon Analizi………………….……………………………………. 8
2.2.1. Robust Yöntemlerin Hedefleri………………………………………..… 9
2.2.2. Robust Kestiriciler……………………..………………………………. 10
iv
2.2.2.1. L Kestiriciler………………………………….……………… 10
2.2.2.1.1. 1L Regresyonu:
LAV (Least Absolute Values) Kestiricisi….............. 10
2.2.2.1.2. LMS (Least Median of Squares) Kestiricisi………... 12
2.2.2.1.3. LMS’ye Dayalı Yeniden Ağırlıklandırılmış EKK
(RLS) Kestiricisi……………….…………………… 13
2.2.2.1.4. LTS (Least Trimmed Squares) Kestiricisi……...….. 13
2.3. Fuzzy Regresyon Analizi…………………………………….………………….. 14
2.3.1. Alt ve Üst Regresyon Doğrularının Hesaplanması……………………. 14
2.3.2. Aralık Regresyonu…………………………..………………….……… 17
2.3.3. Doğrusal Programlama Modelleri……………………..……………… 19
2.3.3.1. Tanaka Modeli……………………….………..…………….. 19
2.3.3.2. Sakawa & Yano Modeli…………………….………..……… 25
2.3.3.3. Peters Modeli………………………..……….……………… 25
2.3.4. Regresyon Katsayılarının Bulandırılması Yöntemi…………………..... 27
2.3.5. Fuzzy En Küçük Kareler (F-EKK) Yöntemi…………………....……… 29
2.3.6. Maksimum Uyum Kriteri ile Fuzzy Regresyon Analizi……………..….. 32
2.3.7. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı…………………… 34
v
2.4. Fuzzy Robust Regresyon Analizi……..…………………………………………. 36
2.4.1. M-Kestiricisi’ne Dayanan
Fuzzy Robust Regresyon Analizi…………………………...………….. 36
2.4.2. Girdi Değişkenlerinin Fuzzy (Bulanık) Olması Durumunda
Robust Regresyon Analizi……………………………………...………. 40
2.4.3. Şanlı K. ve Apaydın A.’nın Önerdiği Algoritma……………………..… 42
3. OTOMOBĐL BEĞENĐ DEĞERĐ FONKSĐYONUNUN BELĐRLENMESĐNDE
DÖRT TEKNĐĞĐN KARŞILAŞTIRILMASI……………………………………... 44
3.1. Regresyon Analizi………………………………………………………………... 47
3.2. Robust Regresyon Analizi………………………………………………………... 48
3.2.1. LMS (Least Median of Squares) Kestiricisi Yöntemi ve RLS…………... 48
3.2.2. LTS (Least Trimmed Squares) Kestiricisi Yöntemi ve RLS…………….. 52
3.3. Fuzzy Regresyon Analizi………………………………………………………… 56
3.3.1. Tanaka Modeli Uygulaması……………………………………………. 56
3.3.2. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı Uygulaması………. 60
3.4. Fuzzy Robust Regresyon Analizi………………………………………………… 62
3.5. Karşılaştırma……………………………………………………………………... 68
vi
4. SONUÇ ve BULGULAR…………………………………………………………. 69
EKLER……………………………………………………………………………….. 72
EK 1. ANALĐZLERDE KULLANILAN OTOMOBĐL MARKALARI…………. 72
KAYNAKLAR….…………………………………………………………………… 73
vii
TABLO DĐZĐNĐ
Tablo 1: Girdi Değişken Verileri ve Hedef Çıktılar……………………..…………… 46
Tablo 2: Girdi Değişken Verileri, Hedef Çıktılar ve LMS’den Elde Edilen Y*, e…... 50
Tablo 3: Girdi Değişken Verileri, Hedef Çıktılar ve LTS’den Elde Edilen Y*, e…… 53
Tablo 4: Kesin ve Fuzzy Y için ( , )j jm s ’ler ……………………………………… 56
Tablo 5: Kesin ve Fuzzy Y Đçin Tahmini Değerler (Y*), FR1 FR2 Đstatistikleri…...... 57
Tablo 6: Kestirilen ja , b ve d ………………………………………………………. 60
Tablo 7: m , *m ve s , *s Değerleri………………………………………………… 61
Tablo 8: Kesin Y için 1 2 3( , , )j j ja a a ’ler………………………………………………. 62
Tablo 9: 2 3 5 6, , ,A A A A Analizden Çıkartıldığında Kesin Y için 1 2 3( , , )j j ja a a ’ler…… 63
Tablo 10: Gözlenen Y ve Tahmin Edilen Y* Değerleri….....………………………… 65
Tablo 11: Dört Tekniğin Karşılaştırması……………………………………………... 68
viii
ŞEKĐL DĐZĐNĐ
Şekil 2.1. Regresyon Doğrusu ile Aykırı ve/veya Uç değer…………………………. 8
Şekil 2.2. LY , UY ve hY α= ’nın Gösterimi…………………………………………… 16
Şekil 2.3. Kesin (Crisp) X ve Kesin (Crisp) Y için Aralık Regresyon Modeli………. 17
Şekil 2.4. Kesin (Crisp) X ve Bulanık Y için Aralık Regresyon Modeli…………….. 17
Şekil 2.5. ja Katsayılarının Üyelik Fonksiyonu……………………………………... 22
Şekil 2.6. iY Değerlerinin Üyelik Fonksiyonu……………………………………….. 23
Şekil 2.7. Tanaka Modelinde Tahminlerin Görünümü……………………………….. 24
Şekil 2.8. Sakawa & Yano Modelinde Tahminlerin Görünümü……………………… 25
Şekil 2.9. Peters Modelinde Tahminlerin Görünümü………………………………… 26
Şekil 2.10. γ Uyum Ölçüsü…………………………………………………………... 33
Şekil 2.11. γ =0 Uyum Ölçüsü , γ =1 Uyum Ölçüsü..………………………………... 33
Şekil 2.12. FLR Model………………………………………………………………... 39
Şekil 2.13. FLR Model ile Aykırı Değer…..…………………………………………. 39
Şekil 3.1. Tahmin Edilen Y*’ların Görünümü……………………………………….. 66
Şekil 3.2. 3 8 43, ,m m my y y ile Birlikte Tahmin Edilen Y*’ların Görünümü…………….. 67
1
1. GĐRĐŞ
Regresyon Analizi en basit anlamda bir veya birden fazla bağımsız değişkenle
bir bağımlı değişkeni açıklama esasına dayanmaktadır. Regresyon terimi ilk olarak 19.
yüzyılda Đngiliz istatistikçi Francis Galton tarafından bir biyolojik inceleme sırasında
ortaya atılmıştır. Galton, baba ve annenin boyu ile çocukların boyu arasındaki bağlantıyı
araştırmak istemiştir. Sonrasında Udny Yule, Karl Pearson yöntemi çeşitli istatistiksel
alanlarda uygulamış ve geliştirmişlerdir. 1
Veri setinde aykırı ya da uç değer olması En küçük Kareler (EKK) Yöntemi ile
kestirilen regresyon parametrelerinin etkinliğini düşürmektedir. Gerçek hayat
verilerinde özellikle sosyal verilerde aykırı ya da uç değerlerle karşılaşıldığından
regresyon parametrelerini daha iyi kestirebilecek yeni tekniklere ihtiyaç duyulmuş ve
robust kestirim yöntemleri geliştirilmiştir. Đlk kez robust kelimesi 1963 yılında Box
tarafından kullanılmış ve EKK kestiricisindeki özellikle normallik varsayımına duyarsız
yaklaşımlar olarak tanımlanmıştır.
1960’lı yıllarda Zadeh’in geliştirdiği Bulanık (Fuzzy) Küme Teorisi yaklaşımı,
nitel değişkenleri sayısal olarak değerlendirme imkanı sunmuştur. Daha sonra 1980’li
yıllarda Tanaka, Bulanık Küme Teorisi’nden yararlanarak Bulanık Doğrusal Regresyon
Analizi Yöntemi’ni geliştirmiştir. Tanaka’nın geliştirdiği Bulanık Doğrusal Regresyon
Analizi yayılımların toplamını minimum yapma esasına dayanmaktadır. Sonrasında
Sakawa ve Yano, Tanka’nın modelini esneterek, gözlem değerlerinin tamamının belirli
aralığa düşmesi yerine, sadece bir kısmının (en az h kadarının) düşmesini yeterli
görmüşlerdir. Sonrasında ise Georg Peters, gerçek verilerle Bulanık Doğrusal
Regresyon Analizi üzerinde çalışırken yeni bir model geliştirmiştir. 2
1 Pearson K., Yule U., Blanchard N., Lee A. "The Law of Ancestral Heredity", Biometrika, 1903
2 Peters G., “Fuzzy Linear Regression with Fuzzy Đntervals”, Fuzzy Sets and
Systems,1994
2
Fuzzy Regresyon Analizi’nde veri setinde aykırı ya da uç değerler
bulunmasında yayılım değerleri büyümektedir. Her ne kadar bağımlı değişken yüksek
yayılımla iyi bir şekilde açıklanabilse de yayılımın düşük olması tercih edilmektedir.
Yayılımın yüksek olduğu ve düzensiz verilerin veri setinde bulunması durumunda
robust yöntemlere ihtiyaç duyulmuştur. Günümüzde Fuzzy Robust Regresyon Analizi
üzerinde çalışmalar devam etmekte, veri setini iyi ifade edebilecek çeşitli robust
yöntemleri içeren algoritmalar geliştirilmektedir.
Đkinci bölümde, Çoklu Doğrusal Regresyon Analizi, Robust Regresyon
Analizi, Fuzzy Regresyon Analizi ve Fuzzy Robust Regresyon Analizi açıklanmıştır.
Açıklanan analizlerde üç tip fuzzy sayısı gösterimi kullanılmıştır. Bu gösterimlerden
ilki, 1 2 3( , , )A a a a=∼
’dir. Burada 2a merkez değerini, 1a sol değeri, 3a ise sağ değeri
ifade etmek üzere, 1 2 3( , , )A a a a=∼
üçgen fuzzy sayısıdır. Gösterimlerden ikincisi,
( , )A m s=∼
’dir. Burada m merkez değerini, s ise yayılım değerini ifade etmek üzere,
( , )A m s=∼
simetrik üçgen fuzzy sayısıdır. Gösterimlerden üçüncüsü ise, ( , , )i i i iX x ζ ζ=
ve ( , , )i i i iY y η η= ’dir. Burada ix merkez değerini, iζ sol yayılım değerini, iζ ise sağ
yayılım değerini ifade etmek üzere, ( , , )i i i iX x ζ ζ= üçgen fuzzy sayısı; iy merkez
değerini, iη sol yayılım değerini, iη ise sağ yayılım değerini ifade etmek üzere
( , , )i i i iY y η η= üçgen fuzzy sayısıdır.
Üçüncü bölümde 45 otomobil markasına ait teknik verilerle açıklanan her bir
analizle otomobil beğeni değeri fonksiyonu oluşturulmaya çalışılmıştır.
Dördüncü bölümde ise, sonuç ve bulgulara yer verilmiştir.
3
2. ÇOKLU DOĞRUSAL REGRESYON, ROBUST REGRESYON,
FUZZY REGRESYON VE FUZZY ROBUST REGRESYON
2.1. Çoklu Doğrusal Regresyon Analizi
Bağımsız değişken sayısının birden fazla olduğu durumlarda uygulanmak
istenilen regresyon analizi çoklu regresyon adını alır. Amaç, 1 2( , , , )kY f X X X= ⋯
denklemini araştırmaktır. Doğrusal bir ilişki söz konusu olduğunda araştırılmak
istenilen regresyon denklemi, 3
0 1 1 2 2 k kY X X Xβ β β β ε= + + + + +⋯ (2.1)
şeklinde olacaktır.
2.1.1. Çoklu Doğrusal Regresyon Denklemi ve Varsayımı
Çoklu doğrusal regresyon denklemi, bir i ’inci gözlem için,
0 1 1 2 2 ... , 1, 2,...,i i i k ik iY X X X i nβ β β β ε= + + + + + = (2.2)
şeklindedir. Bu eşitlik örneklemden elde edilen istatistiklerle,
0 1 1 2 2 ... , 1, 2,...,i i i k ik iY b b X b X b X e i n∧
= + + + + + = (2.3)
şeklini alacaktır.
(2.3) denkleminin iyi bir kestirimi için şu varsayımlar sağlanmalıdır. 4
(1) X matrisi ( 1)k + ranklı olmalıdır. Yani denklemler doğrusal bağımsız
olmalıdır.
3 Erar A., “Bağlanım (Regreyon) Çözümlemesi, Ders Notları…”, MSGSÜ, Đstatistik,
Eylül 2006, s:73
4 Erar A., s:77
4
(2) ( ) 0, i=1,2,...,n için.iE ε = (2.4)
(3) 2( ) , i=1,2,...,n için.iV ε σ= (2.5)
(4) ( , ) 0 i jCov ε ε = (2.6)
jX ’lerin raslantı değişkeni oldukları durumlarda,
(5) ( , ) 0, i=1,2,...,n için.i iCov x ε = (2.7)
Đstatistiksel çıkarsamalarda,
(6) 2(0, )Nε σ∼ . (2.8)
2.1.2. Çoklu Doğrusal Regresyonda En Küçük Kareler
(EKK) Kestirimi
En küçük kareler yöntemi ile amaç,
2 2( )i iiy y e∧
− =∑ ∑ (2.9)
eşitliğini en küçükleyen regresyon katsayılarının kestirimini bulmaktır. β ’nın EKK ile
kestirimi şu şekilde olacaktır (altı çizili ifadeler ifadenin vektör olduğu anlamındadır);
'2 ' '
' ' ' '' '
( ) ( ) ( ) ( )
ie e e Y Y Y Y Y X Y X
Y Y Y X X Y X X
β β
β β β β
∧ ∧ ∧ ∧
∧ ∧∧ ∧
= = − − = − −
= − − +
∑ (2.10)
' ' 'Y X X Yβ β∧∧
= olduğundan,
' ' '' '2Y Y X Y X Xβ β β∧ ∧ ∧
= − + (2.11)
eşitliği β∧
’ya göre türevi alınıp sıfıra eşitlenirse,
5
' ' '' '
' '( 2 )
2 2 0Y Y X Y X X
X Y X Xβ β β
ββ
∧ ∧ ∧∧
∧
∂ − += − + =
∂ (2.12)
olacaktır. Buradan,
'X X β∧
= 'X Y (2.13)
β∧
= ' 1 '( )X X X Y− (2.14)
bulunur. 5 Burada,
0
1
k
b
b
b
β∧
=
⋮
1 2
21 1 2 1
' 22 2
2k
...
...
...
(Simetrik)
k
k
k
n X X X
X X X X X
X X X X X
X
=
∑ ∑ ∑∑ ∑ ∑
∑ ∑
∑⋮
1
'2
k
Y
X Y
X Y X Y
X Y
=
∑∑∑
∑⋮
‘dır.
2.1.3. Anlamlılık Testleri
Çoklu doğrusal regresyonda genelde iki tür test kullanılır.
1. Tümel-F testi (varyans çözümlemesi)
2. T-testi
5 Erar A., s:79
6
2.1.3.1. Tümel-F Testi (Varyans Çözümlemesi)
Tümel-F testi (varyans çözümlemesi) şu amaçlarla yapılır: 6
1) Bir bağımlı değişkenin k sayıda bağımsız değişkence birlikte açıklanıp
açıklanmadığının incelenmesi: Değişkenler arasında doğrusal bir bağıntının
kurulabilmesi varyans çözümlemesi ile araştırılabilir.
2) Denklemlerin karşılaştırılması: Aynı konu ile ilgili değişik bağlanım
denklemleri F-testi yardımıyla karşılaştırılarak hangi denklemin kullanımının daha
uygun olduğuna karar verilebilir.
Tümel-F testi,
0 1 2: ... 0kH β β β= = = = (2.15)
hipotezinin,
1 : En az bir sıfırdan farklıdır.jH β (2.16)
hipotezine karşı test edilmesidir. Test sonucunda 0H kabul edilirse, bağımlı ve
bağımsız değişkenler arasında doğrusal bir bağıntıdan söz edilemeyeceği α yanılgısı ile
belirtilebilir. Bu demektir ki tüm jX ’lerin,
0y β ε= + (2.17)
denklemine katkısı anlamlı değildir. 0H reddedilir ise bağımlı ve bağımsız değişkenler
arasında 1-α güvenirliği ile doğrusal bir bağıntı kurulabilir; k sayıda değişkenin 0β ’lı
modele birlikte katkısı anlamlıdır. Bununla birlikte, 1H ’in kabul edilmesi tüm jβ ’lerin
sıfırdan farklı oluşunu göstermez. Bu, bazı jβ ’lerin ya da en az bir jβ ’nin anlamlı
6 Erar A., s:86
7
olduğunu gösterir. Bu durumda, regresyon analizi daha ileri aşamalarla
sürdürülecektir. 7
/
/ ( 1)
RKT k RKO RegresyonKarelerOrtalamasıF
AKT n k AKO ArtıkKarelerOrtalaması= = =
− − (2.18)
2' 'BKT X Y n yβ∧
= − (2.19)
' ''AKT Y Y X Yβ∧
= − (2.20)
2.1.3.2. T-Testi
0 1 2: ... 0kH β β β= = = = hipotezi reddedildiğinde, hangi jβ ’lerin sıfırdan
farklı olduğu ya da tüm jβ ’lerin sıfırdan farklı olup olmadıkları, 0 : 0jH β =
hipotezinin 1 : 0jH β ≠ hipotezine karşı testi ile incelenir. Regresyon katsayılarının bu
testi şu amaçlarla yapılır: 8
1) Denklemdeki her bir değişkenin, öteki değişkenlerin etkisi arıtıldıktan sonra
bağımlı değişkeni açıklamadaki önemini araştırmak.
2) Değişkenlerin, bağımlı değişkeni açıklamadaki önemlilik derecelerini
saptamak. t değerleri büyükten küçüğe doğru sıralandığında hangi jX ’nin daha etkin
olduğu görülebilir. Ancak bu sıralama, bağımsız değişkenlerin birbiriyle ilişkili
olmamaları koşulu ile geçerlidir.
7 Đnal H. C., Günay S., “ Olasılık ve Matematiksel Đstatistik”, Hacettepe Üniversitesi
Fen Fakültesi Yayınları, Beşinci Baskı, Ders Kitapları Dizini: 16, 2002, s:86
8 ErarA., s:88
8
3) Model kurmak.
Arka satfadaki 0H ’ın testi,
j
j
b
bt
S= (2.21)
değerinin bulunması ile yapılır. Bu değer 1n k− − serbestlik dereceli tα ile
karşılaştırılır. Hesap Tablot t> durumunda 0H reddedilir.
2.1.4. EKK Kestiricisi’nin Etkin Olmadığı Durumlar
Aşağıdaki üç şekilde görüldüğü üzere veri setinde bu gibi aykırı ya da uç değer
bulunması durumunda EKK Kestiricisi iyi sonuç vermemekte, veri setini iyi ifade
edecek kestirimlerde bulunamamaktadır.
Şekil 2.1. Regresyon Doğrusu ile Aykırı ve/veya Uç değer
2.2. Robust Regresyon Analizi
Veri setinde aykırı değerlerin bulunması EKK kestiricisinin etkinliğini
düşürmektedir. Diğer bir ifade ile EKK kestiricisi, veri setini açıklamaya çalışan
regresyon denklemi için iyi bir kestirici olmamaktadır. Uygulamada veri setlerinde
aykırı değerlerle karşılaşıldığından, veri setini daha iyi ifade edebilecek; regresyon
katsayılarını daha iyi kestirebilecek kestiricilere ihtiyaç duyulmuştur. Öte yandan EKK
9
Kestiricisi’nin uygulanabilmesi için gerekli olan varsayımların karşılanmaması
durumunda yeni kestiricilere ihtiyaç duyulmuştur.
Robust kestiriciler bu ihtiyaçları karşılamak için geliştirilmiştir. Robust
kestiricilerin bazıları, LAV, LMS, LTS kestiricileri’dir. Bu bölümde bu kestiriciler
incelenecektir.
Yukarıda bahsedildiği üzere en küçük kareler regresyonu birkaç problem teşkil
etmektedir. Veri setinde tek bir aykırı veya uç değerin olması durumunda en küçük
kareler regresyonu iyi sonuç vermemektedir. En küçük kareler regresyonu bu değerlere
uygulandığında elde edilen tahmini Y değeri (^
Y ) normal dağılıma uysa bile varyansın
sıfır olduğunu ileri süren 0 : 0H σ = hipotezi aykırı/uç değer nedeni ile kabul
edilemeyebilir. Normal olmayan durumlarda ise en küçük kareler regresyonu ile eğim
değerini hesaplamak yanlış olacaktır. Her koşulda iyi sonuç verebilecek tek bir
regresyon kestirim yöntemi henüz keşfedilmemiştir. Bunun için koşullar bazında uygun
olan kestirim yöntemleri seçilmektedir.
2.2.1. Robust Yöntemlerin Hedefleri
Robust kestiricilere değinmeden önce robust regresyon kestiricilerini cazip
kılan özelliklerden bahsedersek;
1) Temel varsayımlar sağlanmadığında EKK’dan daha iyi bir performans
göstermesi,
2) Temel varsayımların sağlandığı durumlarda ise hemen hemen EKK kadar
başarı sağlaması,
3) Aşırı derecede hesaplama ve anlaşılma zorluğuna sahip olmamasının
hedeflendiği söylenebilir.
10
2.2.2. Robust Kestiriciler
2.2.2.1. L Kestirciler
Sıralı istatistiklerin lineer kombinasyonlarını temel alan sağlam kestiriciler L
kestiriciler olarak isimlendirilmektedir. L kestiriciler matematiksel olarak;
(1) (2) ( ), ,..., nχ χ χ n büyüklüğündeki örneklemin sıralı istatistikleri ve 1 2 ... na a a≤ ≤ ≤
gerçel sayılar (0 1 i=1,2,...,n)ia≤ ≤ olmak üzere; 9
1
1n
ii
a=
=∑ koşuluyla L kestiricisi, (2.22)
1
n
i ii
T a x=
=∑ eşitliği ile tanımlanır. (2.23)
Örneğin n büyüklüğündeki bir örneklemin ortalamasının ağırlığının 1/n olduğu
durum bir L kestiricisidir.
L kestiricilerinin hesaplanması kolay olmasına rağmen aykırı değerlere ağırlık
vererek sağlamlıklarından ya da aykırı olmayan değerlere daha küçük ağırlık vererek
etkinliklerinden ödün vermelerine neden olmaktadır. 10
2.2.2.1.1. 1L Regresyonu :LAV (Least Absolute Values) Kestiricisi
Bu yöntem artıkların mutlak değerlerinin toplamlarını minimum yapma esasına
dayanmaktadır. 1 1 2 2( , ), ( , ), ... ,( , )n nX Y X Y X Y gözlem çiftleri için ^
0 1Y b b X= +
denklemi oluşturulmak istensin.
9 Vural A., “Aykırı Değerlerin Regresyon Modellerine Etkileri ve Sağlam Kestiriciler”,
Yüksek Lisans Tezi, Marmara Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2007,
s:29
10 Hoaglin D. C., Mosteller F., Tukey J. W.,”Understanding Robust and Explonatory
Data Analysis”, New York: John Wiley & Sons, 1983, s:339
11
^
1 1 1 1 1 1 0
^
2 2 2 2 1 2 0
^
1 0
,
,
n n n n n
e Y Y Y b X b
e Y Y Y b X b
e Y Y Y b X b
= − = − −
= − = − −
= − = − −
⋮
(2.24)
olsun. Burada her e değeri görüldüğü üzere, ölçülen Y değeri ile tahmini Y değeri (^
Y )
arasındaki farkı temsil etmektedir. Amaç fonksiyonumuz şu şekilde tanımlanabilir:
( )n
1 2i=1
min min ...i ne e e e= + + +∑ (2.25)
Burada her bir ie değerini 0’a eşitleyerek n tane 0b ve 1b bilinmeyenli lineer
denklem sistemi elde edilir. Lineer denklem sisteminin çözülmesi ile 0b ve 1b değerleri
kestirilmiş olunur. Bu yöntem 1L Regresyonu veya diğer adıyla LAV (Least Absolute
Values) Kestiricisi olarak adlandırılmaktadır.
1L Regresyonu’nu iyi bir kestirici kılan özelliği, ölçülen Y değerleri arasındaki
aykırı değerlerin regresyon denklemi üzerindeki etkisini azaltmasıdır. X değerleri ile
en küçük kareler kestiricisinin, Ortalama Y ’yi bulmayı amaçlamasının aksine, 1L
Regresyonu Medyan Y ’yi bulmayı amaçlamaktadır. Fakat 1L Regresyonu X değerleri
arasındaki aykırı ya da uç değerlere karşı etkin değildir. 1L Regresyonu’nun ya da diğer
adıyla LAV Kestiricisi’nin diğer robust regresyon kestiricilere göre daha verimli olup
olmadığı halen daha tartışılmaktadır. 11
11 Andersen R., “Modern Methods for Robust Regression”, SAGE Publications, 2008,
s:49
12
2.2.2.1.2. LMS (Least Median of Squares) Kestiricisi
Hata karelerinin medyanını minimum yapmayı amaçlayan bu yöntemde amaç
fonksiyonu,
2 20 1 1 2 2min( ( )) min( ( ( ... ) )i i i i i i k kimed w e med w y b b x b x b x= − − − − − (2.26)
biçiminde tanımlanır. Burada ie , i ’nci gözlem hatasıdır. Bu yöntemde i ’inci gözlemin
ağırlığı,
1 / 2.5
0 / 2.5
i
i
i
e
w
e
σ
σ
∧
∧
≤
= >
(2.27)
biçiminde hesaplanır.
[ ]2.5,2.5− aralığının dışına düşen standartlaştırılmış hata değerleri, potansiyel
uç ya da aykırı değer olarak düşünülmektedir. Ağırlık fonksiyonunda ( iw ) bu aralığın
dışındaki standartlaştırılmış hata değerlerine 0 değeri, aralık içindeki standartlaştırılmış
hata değerlerine ise 1 değeri atanmaktadır.
2.5 değeri keyfi bir değerdir fakat normal durumda çok az artıklar 2.5σ∧
‘dan
daha büyük olabileceğinden oldukça makul bir değerdir. 12
2.27 numaralı ifadedeki σ∧
,
251.4826 1 ( )imed e
n pσ∧ = + −
(2.28)
12 Rousseeuw P. J., Leroy A. M., “Robust Regression and Outlier Detection”, Jonh
Wiley & Sons, 2003, s:17
13
olarak tanımlanır. Burada n toplam gözlem sayısını, p değişken sayısını ifade
etmektedir. 1.4826 ve 5 sayısı, LMS Kestiricisi için, hata karenin meydanının dağılımını
Normal Dağılım’a yaklaştırmak adına Rousseeuw ve Leroy tarafından önerilmiştir.
2.2.2.1.3. LMS’ye Dayalı Yeniden Ağırlıklandırılmış EKK
(RLS) Kestiricisi
RLS yönteminde ağırlıklandırılmış hata kareler toplamı minimum yapılmaya
çalışılır. Amaç fonksiyonu;
2 20 1 1 2 2min min ( ... )i i i i i i k ki
i i
w e w y b b x b x b x= − − − − −∑ ∑ (2.29)
biçiminde tanımlanır. RLS yönteminde ağırlıklar, 2.27 numaralı ifadedeki fonksiyonla
hesaplanır. 2.27 numaralı ifadedeki σ∧
değeri, 2.28 numaralı eşitlik yardımıyla
hesaplanır.
2.2.2.1.4. LTS (Least Trimmed Squares) Kestiricisi
LTS kestiricisi yöntemi 1984 yılında Rousseeuw tarafından geliştirilmiştir. Bu
yöntem budanmış hata kareler toplamını minimize etme esasına dayanmaktadır. Bu
yöntemde amaç fonksiyonu şu şekilde tanımlanmaktadır: 13
2( )
1
minq
ii
e=∑ (2.30)
Burada [ ](1 ) 1q n td= − + ’dır. Yöntem budanmış (trimmed) her bir gözlem için
hesaplanan hata karelerinin toplamı şeklinde işlemektedir. Burada td , budanma oranını,
n ise, örneklem büyüklüğünü ifade etmektedir.
13 Andersen R., “Modern Methods for Robust Regression”, SAGE Publications, 2008,
s:49
14
2.3. Fuzzy Regresyon Analizi
Bir fuzzy regresyon modeli, sistemin içermesi gereken olanaklı bütün
gözlemlenmiş veriyi değerlendirir. Bir başka ifade ile fuzzy regresyon modeli,
gözlemlenen tüm verileri içeren bir model oluşturmayı amaçlar. 14
2.3.1. Alt ve Üst Regresyon Doğrularının Hesaplanması
iY bağımlı değişkeni ve jX açıklayıcı değişkenleri reel değerlidirler. Fakat
model parametreleri jA∼
’ler bulanık sayılardır. iY ’nin iY∼
’ye dönüşmesi yani bulanık
olarak kestirilmesinin sebebi; reel değerli açıklayıcı değişkenlerin, bulanık
parametrelerle işleme girmesindendir. 15
1 1 0 0 1 1 1... ( ) ( ) ... ( )U U Uj n jn j n n jnY A X A X m s m s X m s X= + + = + + + + + +
∼ ∼ ∼
(2.31)
1 1 0 0 1 1 1... ( ) ( ) ... ( )L L Lj n jn j n n jnY A X A X m s m s X m s X= + + = − + − + + −
∼ ∼ ∼
(2.32)
Bulanık doğrusal regresyon analizinde belli bir h seviyesinde kesilen bulanık
parametreler üzerinden Y∼
bulanık bağımlı değişkeninin değerleri tahmin edilmektedir.
LY ve UY doğruları h a= seviyesinde hesaplanan h aY = tahmin doğrusunu alttan ve
üstten kapsamaktadırlar.
14 Watada J., Yabuuchi Y., “Fuzzy Robust Regression Analysis”, Department of
Industrial Management, Osaka Institute of Technology, 5-16-1 Omiya, Asahi, Osaka
535 Japan, 0-7803-1896-X/94 1994 IEEE, s:1370-1371
15 Yücel L. Đ., “Bulanık Regresyon : Türkiye’de 1980-2004 Döneminde Kayıt Dışı
Ekonominin Bulanık Yöntemlerle Tahminine Đlişkin Bir Uygulama”, Yüksek Lisans
Tezi, Đstanbul Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2005, s:48
15
Üst regresyon analizinde amaç, [ ] , 1,2,...,Ui ih h
Y Y i N ≤ = kısıtı altında;
U Uj iji j
J s X=∑ ∑ amaç fonksiyonunu minimize eden ( , )U U Ui iA m s=
∼
bulanık
optimal katsayıları bulmaktır.
min U Ui iji j
J s X=∑ ∑ (2.33)
[ ] Ui ih h
Y Y ≤ (2.34)
1,2,..., , 1,2,..., , 0 h 1i n j k= = ≤ ≤
Yukarıda belirtilen doğrusal programlama problemi ile belirtilmek istenen, iY
gözlem değerinin h seviyesinde tahmin edilen UY bulanık tahmin kümeleri tarafından
kapsanması kısıtı altında, U Uj iji j
J s X=∑ ∑ toplam yayılımını minimize ederek
bulanık üst regresyon modelinin parametrelerine ilişkin optimum merkez ve yayılım
değerlerini bulmaktır. 16
L Lj iji j
J s X=∑ ∑ amaç fonksiyonunu minimize eden ( , )L L Li iA m s=
∼
bulanık optimal katsayıları bulmaktır.
min L Li iji j
J s X=∑ ∑ (2.35)
[ ] Li ih h
Y Y ≥ (2.36)
1,2,..., , 1,2,..., , 0 h 1i n j k= = ≤ ≤
16 Yücel L. Đ., s:49
16
Üst regresyon doğrusunun bulunması ile aynı mantık izlenerek, iY gözlem
değerlerinin h seviyesinde tahmin edilen LY bulanık tahmin kümeleri tarafından
kapsanması kısıtı altında, L Li iji j
J s X=∑ ∑ toplam yayılımını minimize ederek
bulanık alt regresyon modelinin parametrelerine ilişkin optimum merkez ve yayılım
değerlerini bulmaktır. 17
Sonuç olarak iY reel değerli gözlem değerlerinin tümü, LY ve UY alt ve üst
regresyonlarının oluşturdukları bulanık doğrusal regresyon aralığında yer almalıdırlar.
Şekil 2.2. LY , UY ve hY α= ’nın Gösterimi 18
17 Yücel L. Đ., s:49-50
18 21 Shapiro A. F., “Fuzzy Regression Models”, Smeal College of Business, University
Park, PA 16802, USA s:5
17
2.3.2. Aralık Regresyonu
Bu yönteme göre, fuzzy (bulanık) veriler ve fuzzy regresyon katsayıları aralık
sayılar olarak ele alınır. Fuzzy regresyon katsayıları, tüm bulanık çıktıların bir fuzzy
regresyon modelinin sınırları içerisinde yer alması düşüncesi ile belirlenir. Kesin (crisp)
X ve kesin (crisp) Y için aralık regresyon modeli Şekil 2.3 ile, Kesin (crisp) X ile
bulanık Y için aralık regresyon modeli Şekil 2.4 ile gösterilmiştir.
Y
X
Şekil 2.3. Kesin (Crisp) X ve Kesin (Crisp) Y için Aralık Regresyon Modeli 19
Y
X
Şekil 2.4. Kesin (Crisp) X ve Bulanık Y için Aralık Regresyon Modeli 20
19 , 20 Düzyurt S., “Bulanık Regresyon ile Tahmin ve Bir Uygulama”, Yüksek Lisans
Tezi, Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Endüstri Mühendisliği Ana Bilim
Dalı, Haziran 2008, Ankara, s:35
18
0 1Y A A X∧
= +∼ ∼
doğrusal modeli için 0 0 0( , )A m s=∼
ve 1 1 1( , )A m s=∼
fuzzy
regresyon katsayılarını elde etmek amacıyla, 21
0 11
min n
ii
ns s X=
+ ∑ (2.37)
0 0 1 1 ,( ) ( ) i=1,2,...,ni i Lm s m s X Y− + − ≥ (2.38)
0 0 1 1 ,( ) ( ) i=1,2,...,ni i Um s m s X Y+ + + ≤ (2.39)
0 10, s 0s ≥ ≥ (2.40)
biçiminde tanımlanan doğrusal programlama problemi çözülür. Burada ,i LY ve ,i UY her
bir bulanık gözlem için sırasıyla alt ve üst sınırları göstermektedir. (2.37) ile belirlenen
amaç fonksiyonu, regresyon modelindeki toplam bulanıklığı gösteren genişliğin en
küçüklenmesidir. (2.38) ve (2.39) kısıtları gözlenen tüm bulanık verileri bulanık
regresyon modeli içerisinde sınırlandırmak üzere kullanılmaktadır.
21 Yücel L. Đ., s:44
19
2.3.3. Doğrusal Programlama Modelleri
2.3.3.1. Tanaka Modeli
FLR ( Fuzzy Linear Regression) modelinin genel yapısı aşağıdaki gibidir:
0 1 1 ... 1,2,...,i k kY A A X A X i n= + + + =∼ ∼ ∼ ∼
(2.41)
0 0 1 1 1( , ) ( , ) ... ( , ) 1,2,...,i k k kY m s m s X m s X i n= + + + =∼
(2.42)
Bu modelde bağımlı değişken olan gözlem değerleri jX kesin sayılar olmasına
karşın ilişkinin bulanıklığı nedeni ile bulanık sayı olarak kestirilir. Regresyon
denkleminin hata miktarı, sistem parametrelerinin toplam bulanıklığına eşit olacaktır. 22
Bu nedenden dolayı aynı zamanda regresyon denklemi olan bu modelde, epsilon ( )ε
değeri bulunmamakta ve epsilon, kendini sistem parametrelerinin toplam bulanıklığında
göstermektedir. Bulanıklığı minimize ederek en az hataya ulaşılmış olunur. Bu nedenle
doğrusal programlama yöntemi kullanılarak tahmin değerlerin gözlem değerlerini belirli
bir h seviyesinde içermesi kısıtı altıda bulanık parametrelerin toplam yayılımları
minimize edilir. Uygun ve doğru bir yayılımın elde edilebilmesi, h değerinin
büyüklüğü ile doğru orantılıdır. Diğer bir ifade ile, 0 ile 1 arasında değer alan h değeri
ne kadar 1’e yakınsa, uygun ve doğru bir yayılım elde edilebilmesi olasılığı 1’e
yakındır.
Tanaka modeli aşağıdaki doğrusal modelin çözülmesiyle elde edilir:
0 1 2 ( ... )kMinimize s s s s+ + + + (2.43)
( )0 0 , ( (1 ) ) (1 )j j ij iji için m h s m h s X y∀ + − + + − ≥∑ (2.44)
( )0 0 , ( (1 ) ) (1 ) j j ij iji için m h s m h s X y∀ − − + − − ≤∑ (2.45)
22 Yücel L. Đ., s:53
20
0js ≥ (2.46)
1,2,..., , 1, 2,...,i n j k= =
Doğrusal programlama modelinde ifade edilen amaç fonksiyonunda toplam
yayılım minimize edilmeye çalışılmaktadır. Kısıtların olduğu bölümde ise, gözlem
değerlerinin belirlenen h seviyesinde tahmin edilen bulanık küme tarafından içerilmesi
gerektiği formüle edilmiştir. Doğrusal programlama modelinin çözülmesiyle bulanık
sistem parametrelerinin diğer bir ifade ile jA∼
’lerin merkez ve yayılım değerleri
hesaplanılmaktadır.
Bu modelde en önemli varsayım Tanaka’nın belirttiği gibi, iY gözlem
değerlerinin tamamının, tahmin edilen alt ve üst sınır tarafından kapsanması gerektiği
varsayımıdır. Bu nedenden dolayı minimum bulanıklık seviyesine ulaşmak zor olabilir.
Tanaka bu varsayımı aşağıdaki şekilde göstermiştir: 23
1, 2,...,i ih
y Y i n ⊂ =
∼
(2.47)
Bu varsayımın sağlanması için tahmin edilen iY∼
’lerin yayılımı artabilir ve
bulanıklık seviyesi bu durumda genişleyebilir. Eğer verilerde aykırı değer söz konusu
ise bu durum kaçınılmazdır ve istemediğimiz bir durumdur. Bu durumdan kaçınabilmek
için amaç fonksiyonunda sadece js ’leri minimize etmek yerine, aynı zamanda ijX ’ler
de hesaba katılır:
0 j iji jMinimize ns s X+∑ ∑ (2.48)
23 Yücel L. Đ., s:54
21
Amaç fonksiyonunun bu şekilde yeniden formüle edilmesi ile doğrusal
programlama problemi aşağıdaki gibi ifade edilir:
0 j iji jMinimize ns s X+∑ ∑ (2.49)
( )0 0 , ( (1 ) ) (1 ) (1 )j j ij i iji için m h s m h s X y h e∀ + − + + − ≥ + −∑ (2.50)
( )0 0 , ( (1 ) ) (1 ) (1 ) j j ij i iji için m h s m h s X y h e∀ − − + − − ≤ − −∑ (2.51)
0js ≥ (2.52)
0 0s ≥ (2.53)
0j ijs X ≥ (2.54)
1, 2,...,i n=
1, 2,...,j k=
22
ja katsayılarının üyelik fonksiyonu aşağıdaki gibidir.
1 , 1, 2,..., ( )
0 , . .j
j j
j j j j j jj jA
m am s a m s k
a s
ö d
µ
−− − < < + ∀ =
=
∼ (2.55)
Şekil 2.5. ja Katsayılarının Üyelik Fonksiyonu 24
24 Shapiro A. F., s:7
23
iY değerlerinin üyelik fonksiyonu ise,
1 , ( )
0 , . .
i
i i
i ii i i iYi
Y YY s Y Y sY
s
ö d
µ
∧
∧ ∧∧
− − − < < +=
(2.56)
şeklindedir.
Şekil 2.6. iY Değerlerinin Üyelik Fonksiyonu 25
25 Shapiro A. F., s:8
24
Elde edilen modelin uygunluğunu ölçmek için aşağıdaki iki istatistik kullanılır.
Bu iki istatistik değerinin mümkün olduğunca küçük olması, modelin uygunluğu
açısından önemlidir. Tanaka uygun bir model için FR1 istatistiğin %5’den, FR2
istatistiğin %10’dan küçük olması gerektiğini öne sürmüştür.
1i i
i
Y YFR
Y
∧
−= (2.57)
2j ij
i
s XFR
Y=∑
(2.58)
Bu doğrusal programlama probleminin çözülmesiyle elde edilen tahminlerin
görünümü aşağıdaki şekilde görüldüğü gibi olacaktır:
Y
X
Şekil 2.7. Tanaka Modelinde Tahminlerin Görünümü 26
26 Yücel L. Đ., s:55
25
2.3.3.2. Sakawa & Yano Modeli
Sakawa & Yano, Tanaka modelinindeki i ih
Y Y ⊂
∼
varsayımını esneterek kendi
model yapısını oluşturmuşlardır. Diğer bir ifade ile, Sakawa & Yano, gözlem
değerlerinin tamamının bu aralığa düşmesi yerine, sadece bir kısmının (en az h
kadarının) düşmesini yeterli görmüşlerdir. 27
Y
X
Şekil 2.8. Sakawa & Yano Modelinde Tahminlerin Görünümü 28
2.3.3.3. Peters Modeli
Peters Modeli; Sakawa & Yano modelinin, reel değerli değişkenlere
uygulanması ile bulunmuştur. Bu haliyle Peters modeli, Tanaka modelinin daha fazla
esnetilmiş bir hali olarak kabul edilmektedir. 29
Peters modelinde doğrusal programlama problemi aşağıdaki gibi tanımlanır: 30
1 2 ( ... ) /ortalama nmaksimize nλ λ λ λ= + + + (2.59)
27 , 28 , 29 , 30 Yücel L. Đ., s:56
26
Kısıtı altında;
0 0 , ( ) ( ) (1 )j j j ij i i ii için m s m s X y eλ∀ + + + ≥ − −∑ (2.60)
0 0 , ( ) ( ) (1 )j j j ij i i ii için m s m s X y eλ∀ − + − ≥ + −∑ (2.61)
0 , (1 )j j ij ortalamai için s X P λ∀ ≤ −∑ (2.62)
0 1iλ≤ ≤ (2.63)
i=1,2,…,n j=1,2,…,k (2.64)
0ortalamaλ ≥ ve 0js ≥ (2.65)
Yukarıdaki denklemde h seviyesi yerine λ kullanılmıştır. Buradaki tek fark,
denenmek istenen farklı λ seviyelerinin ortalaması alınarak tek bir bulanıklık seviyesi,
diğer bir ifade ile, ortalamaλ bulunmuştur. Amaç fonksiyonunu maksimize edilmesiyle en
büyük ortalamaλ seviyesi bulunarak, 0 (1 )ortalamaP λ− değeri minimize edilmek
istenmektedir. 31
Şekil 2.9. Peters Modelinde Tahminlerin Görünümü 32
31 , 32 Yücel L. Đ., s:57
27
Peters modelinin eleştirilen yönü, çözümün 0P ’a karşı duyarlı olmasıdır. Bu
değer analist tarafından belirlenir ve yanlış bir seçim yapıldığında model tamamen
amacından sapabilir, sistem parametrelerinin bulanıklığı Tanaka’nın modelindeki
tahmin sınırlarını da aşabilir. 33
2.3.4. Regresyon Katsayılarının Bulandırılması Yöntemi
Regresyon modelinin parametrelerini bulandırarak bulanık regresyon
parametrelerine ulaşmak uygulamada sıkça tercih edilen ve oldukça basit bir yöntemdir.
Klasik Regresyon Analizi ile elde edilen en iyi modelin katsayıları, seçilen bir h
seviyesinde bulandırılır.
Yöntemin adımları aşağıdaki gibi sıralanabilir: 34
1. adım. Klasik regresyon yöntemi ile en uygun model tespit edilir.
2. adım. Açıklayıcı değişkenlerin gözlem değerleri ortalama değerlerinden
saptırılarak bulandırma işlemine başlanır ve klasik regresyon modeli şu hale dönüşür:
0 ( - )xi i i ortalama
i
Y m m X X∧
= +∑ (2.66)
Örneğin iki adet bağımsız değişken olduğunda,
0 1 1 1 2 2 2 ( - ) ( - )xortalama ortalamaY m m X X m X X
∧
= + + (2.67)
ortalamaX değeri tüm gözlem değerlerin aritmetik ortalaması olabileceği gibi,
sadece en büyük ve en küçük gözlem değerlerinin ortalaması alınarak da bulunabilir.
0.5(max min )ortalama j jX X X= + (2.68)
33 Yücel L. Đ., s:57
34 Uras Y., “Bulanık Mantığın Doğrusal Regresyon Analizinde Kullanılmasına Đlişkin
Bir Uygulama”, Dokuz Eylül Üniversitesi, 1998, Đzmir, s:101-106
28
3. adım. Bağımsız değişkenler ortalamalarından saptırıldıktan sonra bu adımda
parametreler bulandırılır. Bu işlem alttaki formül kullanılarak gerçekleştirilir.
1 1( ) ( )j j j j J j jL h R hβ δ β β η− −− ≤ ≤ + (2.69)
( ) ( ) 1- L X R X X= = ve j jδ η= olduğunu varsayarak bulandırma yapılır. jA
ve jη ’nin değerleri analist tarafından belirlenir. h seviyesi bir sabit girdi olarak [ ]0,1
aralığından seçilir ve analistin çalışacağı bulanıklık seviyesini ifade eder.
0.5 h = alınırsa, ( ) ( ) 1- 0.5 0.5 L h R h= = = bulunur. Bulandırma
işleminde kullanılmak üzere 1 ( )jL h− ve 1 ( )jR h− değerleri aşağıdaki gibi bulunur:
1 ( )jL h− = 1 ( )jR h− = 1/0.5 = 2 elde edilir.
Bulandırma işlemi sonucunda jβ parametresi için bir alt ve bir üst sınır
hesaplanarak jβ aralığı bulunur. Aslında yapılan işlem aralık regresyonu gibi görünse
de 0h ≠ olduğunda analiz, bulanık regresyon analizidir.
4.adım. Y∼
bulanık değerler tahmin edilir. Diğer bir ifade ile
0 ( )j j j ortalamai
Y X Xβ β= + −∑∼ ∼ ∼
denkleminden hesaplanır.
5.adım. iY∼
tahmin değerleri, iY gözlem değerleri ve klasik regresyondan
tahmin edilen iY∧
’lerle kıyaslanarak hangisinin daha iyi olduğuna ilişkin yorumlar
yapılır.
Bulandırma yöntemine yapılan eleştirilerden en önemlisi, 2. adımda bahsedilen
ortalamaX değeri şayet “ 0.5(max min )ortalama j jX X X= + ” ile hesaplanırsa, aykırı
gözlem olduğu durumlarda sınırlar, olduğundan geniş diğer bir ifade ile daha bulanık
tahmin edilir. Yani aykırı gözlem söz konusu olduğunda ortalamalar max ve min
29
gözlem değerleri ile değil de aritmetik ortalama ile hesaplanırsa bu hassasiyet ortadan
kaldırılabilecektir. 35
2.3.5. Fuzzy En Küçük Kareler (F-EKK) Yöntemi
Fuzzy (Bulanık) En Küçük Kareler (F-EKK) Yöntemi, tahmin edilen ^
iY
bulanık bağımlı değişken değerleri ile gözlenen iY değerleri arasındaki bulanık
mesafeyi minimize etme esasına dayanmaktadır.
^
0 1 1i iY A A X= +∼ ∼
olarak tanımlı FLR modelinde, 0 0 0( , )A m s=∼
ve 1 1 1( , )A m s=∼
olmak üzere, 0m ve 1m merkez değerleri, 0s ve 1s de yayılım değerleridir. Tek
değişkenli FLR modelinde ^
iY bulanık bağımlı değişken değerleri ile gözlenen iY
değerleri arasındaki mesafe (fark) şu denklem ile tanımlanır: 36
2 2
0 1 1 0 1 1 0 0 1 1 1 1
2 20 1 1 0 0 1 1 1 1
( , ) ( , ) ( )
( ) ( )
i i i i i i i i
i i i i i i i
r A A X Y d A A X Y m s m X s X y e
m m X y e m s m X s X y e
+ = + = + + + − −
+ + − − + − + − − −
∑∼ ∼ ∼ ∼
(2.70)
Denkleminin 1. dereceden türevi alınıp sıfıra eşitlenirse, modelin katsayılarına
ilişkin merkez ve yayılım değerlerine ulaşılır. Ancak merkez değerlerinin sıfırdan büyük
olup olmamalarına göre ayrı ayrı çözümler elde edilir: 37
1. Durum: 0 0m > , 1 0m >
Bulanık mesafenin 0m ’a göre 1. dereceden türevi alınıp sıfıra eşitlenirse 0m ’ın
değeri bulunur.
0 1 1 0 0 0 1 1 1 0 0
1 1 1 0 1 1
( , ) / 2 ( ( ) ( ) ( )
( ) ( ) )
i i i i i
i i i i i
r A A X Y m m s m s X y e m s
m s X y e m m X y
∂ + ∂ = − + − − − + +
+ + − + + + −∑
∼ ∼
(2.71)
35 , 36 , 37 Yücel L. Đ., s:60-61
30
1m , 0s ve 1s değerlerini bulmak için de aynı mantık izlenir:
0 1 1 0 0 0 1 1 1 0 0
1 1 1 0 1 1
( , ) / 2 ( ( ) ( )( 1) ( )
( ) ( ) )
i i i i i
i i i i i
r A A X Y s m s m s X y e m s
m s X y e m m X y
∂ + ∂ = − + − − − − + +
+ + − + + + −∑
∼ ∼
(2.72)
0 1 1 1 1 0 0 1 1 1 0 0
1 1 1 0 1 1
( , ) / 2 ( ( ) ( ) ( )
( ) ( ) )
i i i i i i
i i i i i
r A A X Y m X m s m s X y e m s
m s X y e m m X y
∂ + ∂ = − + − − − + +
+ + − + + + −∑
∼ ∼
(2.73)
0 1 1 1 1 0 0 1 1 1 0 0
1 1 1
( , ) / 2 ( ( ) ( ) ( )
( ) ( ))
i i i i i i
i i i
r A A X Y s X m s m s X y e m s
m s X y e
∂ + ∂ = − − + − − − + +
+ + − +∑
∼ ∼
(2.74)
Birinci derecen türev denklemleri sıfıra eşitlenirse 0m , 1m , 0s ve 1s ’in değerleri
hesaplanmış olur.
2 21 ( ) /( ( )i i i i i im n X y X y n X X= − −∑ ∑ ∑ ∑ ∑ (2.75)
0 1ortalama ortalamam y m X= − (2.76)
2 21 ( ) /( ( )i i i i i is n X e X e n X X= − −∑ ∑ ∑ ∑ ∑ (2.77)
0 1ortalama ortalamas e s X= − (2.78)
2. Durum: 0 0m < , 1 0m >
2 21 ( ) /( ( )i i i i i im n X y X y n X X= − −∑ ∑ ∑ ∑ ∑ (2.79)
0 1ortalama ortalamam y m X= − (2.80)
2 21 ( ) /( ( )i i i i i is n X e X e n X X= − −∑ ∑ ∑ ∑ ∑ (2.81)
0 1( )ortalama ortalamas e s X= − − (2.82)
31
3. Durum: 0 0m > , 1 0m <
2 21 ( ) /( ( )i i i i i im n X y X y n X X= − −∑ ∑ ∑ ∑ ∑ (2.83)
0 1ortalama ortalamam y m X= − (2.84)
2 21 ( ) /( ( )i i i i i is n X e X e n X X= − −∑ ∑ ∑ ∑ ∑ (2.85)
0 1ortalama ortalamas e s X= − (2.86)
4. Durum: 0 0m < , 1 0m <
2 21 1 1( ) /( ( )i i ortalama i i ortalama i im n X y X y n X X= − −∑ ∑ ∑ ∑ ∑ (2.87)
0 1ortalama ortalamam y m X= − (2.88)
2 21 1 1 1 1( ) /( ( )i i i i i is n X e X e n X X= − − −∑ ∑ ∑ ∑ ∑ (2.89)
0 1( )ortalama ortalamas e s X= − − (2.90)
Tek bağımsız değişkene sahip bir model için bu çıkarımlar söz konusudur.
Birden fazla bağımsız değişkene sahip bir model için farklı çıkarımlar söz konusu
olacaktır. Modelin sahip olduğu bağımsız değişkene göre farklı çıkarımların türetilmesi
yöntemin kullanabilirliği açısından dezavantaj olarak düşünülebilinir.
32
2.3.6. Maksimum Uyum Kriteri ile Fuzzy Regresyon Analizi
Celmins, bulanık en küçük kareler regresyonu için veri ve model tahmini
arasındaki uyum ölçüsüne dayanan bir yaklaşım önermiştir. 38 ( )A
xµ ∼ ve ( )B
xµ ∼ sırasıyla
A∼
ve B∼
bulanık sayılarının üyelik fonksiyonları olmak üzere, A∼
ve B∼
için uyum
ölçüsü ( , )A Bγ∼ ∼
biçiminde gösterilsin. Eğer ( )A
xµ ∼ ve ( )B
xµ ∼ normalleştirilmiş üçgen
üyelik fonksiyonları ise Şekil 2.10’da gösterildiği gibi ( , )A Bγ∼ ∼
,
{ }( , ) max min ( ), ( )x A B
A B x xγ µ µ= ∼ ∼
∼ ∼
(2.91)
biçiminde açıklanır. Burada [ ]0,1γ ∈ olacaktır ve Şekil 2.11’de gösterildiği gibi eğer iki
bulanık sayı örtüşmüyorsa 0γ = , eğer iki bulanık sayısının merkezleri çakışıyorsa 1γ =
değerini alacaktır. 39
Bu yaklaşıma göre amaç, veri ve model arasından maksimum genel uyum
derecesine sahip bir modelin belirlenmesidir. iγ , veri seti ve tahmin denklemi
arasındaki uyum derecesini göstermek üzere; genel uyum ölçüsü iγ ’nin 1’den
sapmalarının kareleri toplamına eşit olacaktır. Burada amaç, 40
2
1
min (1 )m
ii
W γ=
= −∑ (2.92)
biçiminde verilen W fonksiyonunun en küçüklenmesidir.
38 Başer F., “Aktüeryal Modellemede Melez Bulanık Regresyon Analizi”, Yüksek Lisans
Tezi, Ankara Üniversitesi, F.B.E., Đstatistik Ana Bilim Dalı, 2007, s: 21
39 Başer F., s:21
40 Shapiro A. F., s:14
33
µ A∼
B∼
1
(1 )γ−
γ
Şekil 2.10. γ Uyum Ölçüsü 41
µ γ =0 µ γ =1
1 1
Şekil 2.11. γ =0 Uyum Ölçüsü , γ =1 Uyum Ölçüsü 42
41 , 42 Shapiro A. F., s:14
34
Bu yaklaşıma göre maksimum uyum kriterini kullanarak bulanık en küçük
kareler regresyonu için model,
0 1Y A A X∧
= +∼ ∼
(2.93)
2 2 20 1 0 01 12m m X s s X s X= + ± + + (2.94)
biçiminde oluşturulur. 43
(2.94) denkleminin ilk kısmı olan 0 1m m X+ , bulanık regresyon modelinin
merkez doğrusunu göstermektedir. 0m ve 1m katsayıları ağırlıklı en küçük kareler
regresyonu yardımıyla elde edilir. (2.94) denkleminin ikinci kısmı
2 2 20 01 12s s X s X± + + , bulanık regresyon modelinin alt ve üst sınırlarını göstermektedir.
0s ve 1s ise 0A∼
ve 1A∼
bulanık katsayılarının genişliklerini ifade etmektedir. Celmins’e
göre 01s , 0A∼
ve 1A∼
arasındaki bulanık uyumluluk olarak tanımlanmıştır ve klasik
parametrelerdeki kovaryansa karşılık gelmektedir. Đteratif hesaplamalar sonucunda 0s ,
1s ve 01s , [ ]0,1 aralığı içerisinde elde edilir. 44
2.3.7. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı
iY simetrik üçgensel fuzzy sayısı, { }( , ) 1,2,...,i i iY m s i n≡ ∈ biçiminde
tanımlanabilir. Lineer regresyon analizini ise matris formatında şu şekilde
tanımlayabiliriz: 45
mε*m = m + burada *m = Xa , (2.95)
sε*s = s + burada b d+* *s = m 1 . (2.96)
43 Shapiro A. F., s:14
44 Başer F., s:23
45 D’Urso P., Gastaldi T., “A Least-Squares Approach to Fuzzy Linear Regression
Analysis”, Computational Statistics & Data Analysis 34 (2000) s:430
35
Burada X ; x ( 1)n k + boyutlu girdi verilerinden oluşan matrisi, a ; regresyon
parametrelerini içeren 1 x ( 1)k + boyutlu vektörü, m ve *m ; sırasıyla gözlenen ve
tahmin edilen çıktı verilerinden oluşan, her ikisi de x 1n boyutlu matrisi, s ve *s ;
sırasıyla gözlenen ve tahmin edilen yayılımlardan oluşan, her ikisi de x 1n boyutlu
matrisi, 1 ; bütün değerleri 1’den oluşan x 1n boyutlu vektörü, b ve d ; yayılım
regresyon modeli olarak adlandırılan ikinci regresyon modelinin parametrelerini ifade
etmektedir.
* * *( , ) ve ( , )i i i i i iY m s Y m r≡ ≡ arasındaki öklid uzaklık şu şekilde tanımlanabilir:
* * 2 * 2( , ) ( ) ( )i i i i i i iY Y m m s sδ δ≡ = − + − . (2.97)
Fuzzy lineer regresyon analizine EKK yaklaşımı öklid uzaklıklarının toplamını
minimize etme esasına dayanmaktadır. 46
2
1
( , , ) .n
ii
b dϕ δ=
≡ =∑ * * * *a (m - m )'(m - m ) + (s - s )'(s - s ) (2.98)
EKK’nın iteratif çözümü sonrasında parametre değerlerin kestirimi şu şekilde
olacaktır. 47
1
2
1
1(( ) ( )),
(1 )
( ) ( ),
1( ).
b bdb
b d
d bn
−
−
= −+
=
=
a X'X X' m + s 1
a'X'Xa s'XA - a'X'1
s'1- a'X'1
(2.99)
46 , 47 D’Urso P., Gastaldi T., s:430
36
2.4. Fuzzy Robust Regresyon Analizi
Fuzzy Robust Regresyon yaklaşımı, veri seti üzerindeki düzensiz verilerin
model üzerindeki etkisini azaltmak amacıyla kullanılan bir yöntemdir. Ishibuchi, bazı
marjinal etkiye sahip verileri silmeye yönelik bir yaklaşım önermiştir. Watana ve
Yabuuchi, genetik algoritma yöntemini kullanarak düzensiz verileri içerisinde
barındıran bir yaklaşım önermiştir. Ayrıca Watana ve Yabuuchi, hipereliptik fonksiyona
( 2 ( )y f x= ) dayanan bir robust FLR yaklaşımı önermiştir. Chen, önceden belirlenmiş
k sınırlayıcı (pre-assigned k -limiting) yöntemini kullanarak modifiye güven aralığı
yöntemini önermiştir. Yang ve Liu, gürültü küme (noise cluster) yöntemini kullanarak
yeni bir fuzzy en küçük kareler algoritmasını önermişler ve bu algoritma ile düzensiz
verilerin model üzerinde olumsuz etkilerini gidermeye çalışmışlardır.
2.4.1. M-Kestiricisi’ne Dayanan Fuzzy Robust Regresyon Analizi
Fuzzy robust regresyon modeli, modeldeki tüm verilerle inşa edilmeye,
oluşturulmaya çalışılır. Gerçek dünyada veriler arasında düzensiz verilerin bulunması
kaçınılmazdır. Bu düzensiz veriler, gözlenen değerlerdeki hatalardan, gözlem
metotlarındaki eksiklik, hata veya yanlışlıklardan, gözlenen değerlerin kaybolmasından,
verinin aykırı ya da uç değer olmasından ya da diğer nedenlerden kaynaklanmaktadır.
Bunun sonucu olarak, bu tip verileri klasik regresyon yaklaşımı ile kurmaya
çalıştığımızda, kurulan model gerçekliğini yitirmektedir. Bu yüzden bu yaklaşımda
düzensiz verilerin model üzerindeki etkisi, modelin kurulması aşamasında ortadan
kaldırılması amaçlanmaktadır. 48
Üçgen fuzzy sayısı, 1 ja ve 3 ja iki uç noktayı, 2 ja merkez noktayı göstermek
üzere, 1 2 3( , , )j j j jA a a a= bulanık aralığı olarak tarif edilebilinir.
48 Watada J., Yabuuchi Y., s:1370
37
0 1 ... 1,...,i ij j ijY A A x A x i n= + + + = (2.100)
olmak üzere, jA ’nin üyelik fonksiyonu: 49
1
2
1 2
2 1
3
2 3
3 2
3
0 ,
1 ,
( )
1 ,
0 ,
i
j
jj j
j j
A
jj j
j j
j
x a
a xa a
a ax
x aa a
a a
x a
µ
<
− − ≤ −=
− − ≤ −
>
(2.101)
ve ( )( ) ( )1 3,h h
jh j jA a a= , h -kesit (cut) aralığıdır. Burada ( )1 1 2 1( )h
j j j ja a a a h= + − ve
( )3 3 3 2( )h
j j j ja a a a h= − − ‘dir. Fuzzy üçgen sayılarla oluşturulan FLR model: 50
*10 20 30 0 11 21 31 1 1 2 3
1 2 3
( , , ) ( , , ) ... ( , , )
, ,
j i i j j j ij
j ij j ij j ijj j j
Y a a a x a a a x a a a x
a x a x a x
= + + +
= ∑ ∑ ∑
(2.102)
‘dir.
49 , 50 Sohn B. Y., “Robust Fuzzy Linear Regression Based on M-estimators”, J. App1.
Math. & Computing Vol:18, No:1-2, 2005, s:596
38
Bu modele ait üyelik fonksiyonu ise; 51
*
1
2
1 2
2 1
3
2 3
3 2
3
0 ,
1 , ( )
( )
1 , ( )
0 ,
i
j ijj
jj
j ij j ijj jj j ij
j
Yj
jj ij j ij
j jj j ijj
j ijj
y a x
a y
a x y a xa a x
yy a
a x y a xa a x
y a x
µ
< −
− ≤ ≤−
= −
− ≤ ≤−
>
∑
∑∑ ∑∑
∑∑ ∑∑
∑
(2.103)
‘dir.
Aşağıdaki fuzzy lineer programlama probleminin çözümü ile 1 ja , 3 ja ve 2 ja
tahmin edilebilinir. 52
( ) ( )1 1
2 1 3 20 0 0 0
p pn n
j j ij j j iji j i j
Minimize a a x a a x− −
= = = =
− + −∑∑ ∑∑ (2.104)
Kısıtı altında;
( )
( )
2 2 1
2 2 1
2 1
3 2
, (1 ) (1 )
, (1 ) (1 )
( ) 0
( ) 0
j j j ij ij j
j j j ij ij j
j j
j j
i için a h a a x y h e
i için a h a a x y h e
a a
a a
∀ − − − ≤ − −
∀ − − − ≥ + −
− ≥
− ≥
∑ ∑
∑ ∑ (2.105)
51 Sohn B. Y., s:596
52 Sohn B. Y., s:597
39
Sırasıyla uç noktalar olan 1 j ijj
a x∑ ve 3 j ijj
a x∑ fuzzy üçgen sayıları alt limit
çizgisi ve üst limit çizgisidir (Şekil 2.12). Aykırı değer çıktısına sahipsek Şekil 2.13 ‘de
görüldüğü gibi üst ve alt limit sınırları aykırı değeri kapsamaktadır.
Şekil 2.12. FLR Model 53 Şekil 2.13. FLR Model ile Aykırı Değer 54
Merkez nokta olan 2 ja ’nin ve artık olarak mjr ’nin M- Kestirici yöntemiyle
tanımlanması aşağıdaki gibidir: 55
mj i mj ijj
r y a x= −∑ . (2.106)
3 1( )mjIQR r Q Q= − (2.107)
Burada 1Q ve 3Q , sırasıyla birinci ve üçüncü kartillerdir. Düzensiz çıktı verisi,
sınırı aşan arama puanlama yöntemiyle bulunabilir.
1 31.5 x ( ) veya 1.5 x ( )mj mjQ IQR r Q IQR r− + (2.108)
53 , 54 Sohn B. Y., s:595
55 Sohn B. Y., s:597
40
Şimdi mh ’yi tanımlayalım. 56
i mi mim
i mi
y y rh
y y
−= = (2.109)
Burada mi mj ijj
y a x=∑ ’dir. i . çıktı verisi düzensiz ise (2.105) nolu kısıtlar
altındaki i . kısıtın h ve iy ’si, M - Kestirim Yöntemine dayanan mh ve uydurulmuş
değer olan miy tarafından değiştirilir.
Büyük değer iy , büyük yayılımın ve düzensiz çıktı verisinin etkisini azaltmak
için, mh ve miy tarafından küçültülür. 57
2.4.2. Girdi Değişkenlerinin Fuzzy (Bulanık) Olması Durumunda
Robust Regresyon Analizi
Çoklu doğrusal regresyon modeli;
0 1 1 2 2 ... p pY X X Xβ β β β ε= + + + + + (2.110)
şeklindedir. Aşağıda çoklu doğrusal regresyon modeli ele alınarak, genelleştirilmiş bir
lemma olarak verilmiştir.
Lemma: Çoklu doğrusal regresyon durumunda genelleştirilmiş optimizasyon
problemi, 58
20 1 2 0 1 1 2 2: ( , , ,..., ) ( ... , )p i i p pi iP Minimize r b b b b d b b X b X b X Y= + + + +∑ (2.111)
56 , 57 Sohn B. Y., s:597
58 Şanlı K., Apaydın A., “The Fuzzy Robust Regression Analysis, The Case of Fuzzy
Data Has Outlier” G.Ü. Fen Bilimleri Dergisi, 2004, s:77
41
olarak yazılmaktadır. Burada 0 1 2, , ,..., pb b b b kesin sayılar, ( ), ,i i i iX x ζ ζ= ,
( , , )i i i iY y η η= üçgen bulanık sayılar olmak üzere,
2
0 1 1 0 1 1 2 2 1 1 2 2( ... , ) ... ( ... )i p pi i i i p pi i p p id b b X b X Y b b x b x b x y b b bζ ζ ζ η + + + = + + + + − − + + + −
2
0 1 1 2 2 1 1 2 2... ( ... )i i p pi i p p ib b x b x b x y b b bζ ζ ζ η + + + + + − + + + + −
( )2
0 1 1 2 2 ...i i p pi ib b x b x b x y+ + + + + − (2.112)
‘dir. P probleminin en küçüklenmesi sonucunda,
' ' ' 1 ' ' '( ) ( )X X A A B B X Y AC B Dβ∧
−= + + + + (2.113)
olarak bulunur. 59 Burada iX ’e ait ( ), ( )i isol yayılım sağ yayılımζ ζ ve iY ’ye ait
( ), ( )i isol yayılım sağ yayılımη η analist tarafından belirlenmektedir.
Literatüre baktığımızda genellikle iX ’e ait ( ) / 7i isol yayılım xζ = ,
( ) / 6i isağ yayılım xζ = olarak, iY ’ye ait ( ) / 8i isol yayılım yη = , iY ’ye ait
( ) / 7i isağ yayılım yη = olarak belirlendiğini görmekteyiz. Yayılım değeri negatif bir
sayı olamayacağından yayılımlar mutlak değer cinsinden hesaplanır.
Burada,
11 1
12 2
1
1
1
1
p
p
n pn
x x
x xX
x x
=
⋯
⋯
⋮ ⋮ ⋮
⋯
1
2
n
y
yY
y
=
⋮
1 1
2 2
n n
y
yC
y
η
η
η
−
− = −
⋮
1 1
2 2
n n
y
yD
y
η
η
η
+
+ = +
⋮
59 Şanlı K., Apaydın A., s:77
42
11 11 1 1
12 12 2 2
1 1
1 ( ) ( )
1 ( ) ( )
1 ( ) ( )
p p
p p
n n pn pn
x x
x xB
x x
ζ ζ
ζ ζ
ζ ζ
+ + + +
= + +
⋯
⋯
⋮ ⋮ ⋮
⋯
11 11 1 1
12 12 2 2
1 1
1 ( ) ( )
1 ( ) ( )
1 ( ) ( )
p p
p p
n n pn pn
x x
x xA
x x
ζ ζ
ζ ζ
ζ ζ
− −
− − =
− −
⋯
⋯
⋮ ⋮ ⋮
⋯
olarak tanımlanır. Gözlem sayısı 1, 2,...,i n= ve değişken sayısı 1, 2,...,j p= ’dir.
Parametre tahminlerinin elde edilebilmesi için ( ' ' 'X X A A B B+ + )’nin tersinin
alınabilmesi gerekmektedir.
2.4.3. Şanlı K. ve Apaydın A.’nın Önerdiği Algoritma
Şanlı K. ve Apaydın A., model parametrelerinin kesin sayı, merkezlerinin sıfır
olması gibi bazı dezavantajları gidermeye yönelik bir algoritma geliştirmişlerdir. Bu
nedenle önerdikleri algoritmada tanımlı β∧
’ların tahmininde ağırlık matrisi üyelik
fonksiyonları yardımıyla tanımlamışlar, üyelik matrisinin tanımlanmasında uzaklık
kullanmışlar ve üyelikler kullanılarak ağırlıklandırılmış bulanık en küçük kareler tahmin
edicisi elde etmişlerdir. Önerdikleri algoritma adım adım aşağıda verilmiştir. 60
Adım 1 : ( , , )i i i iX x ζ ζ= , ( , , )i i i iY y η η= üçgensel bulanık sayıları için
parametre tahmini Eşitlik (2.113)’dan elde edilir.
Adım 2 : jY∧
tahmin değerleri ve artıklar ( )ie hesaplanır.
Adım 3 : Artıkların mutlak değerlerine göre medyanı belirlenir ve
( ) ( ( )) ( )id i abs e i medyan e= − (2.114)
uzaklığı hesaplanır. Burada . öklid uzaklığıdır.
60 Şanlı K., Apaydın A., s:78
43
Adım 4 : Uzaklıklara bağlı olarak üyelik fonksiyonu
1
( )
0 ö.d.
e a
b ex a e b
b aµ
≤
−= < <
−
(2.115)
biçiminde tanımlanır. Burada,
( ( ))a medyan d i= (2.116)
max( ( ))b d i= (2.117)
dir.
Adım 5 : Eşitlik (2.115)’de tanımlanan üyelik fonksiyonundan üyelik
dereceleri belirlenir ve ağırlık matrisi ( )W oluşturulur. Ağırlık matrisi köşegen
elemanları üyeliklerden oluşan diagonal matristir. Eşitlik (2.113)’den ağırlıklandırılmış
bulanık en küçük kareler tahmin edicisi,
' ' ' 1 ' ' '( ) ( )X WX AWA BWB X WY AWC BWDβ∧
−= + + + + (2.118)
biçiminde tanımlanır. Bu tahmin edici kullanılarak parametre tahmini yapılır.
Adım 6 : Eğer 1k k
β β ε+∧ ∧
− < ise durulur. Aksi durumda Adım 2’ye gidilir.
Burada β∧
tahmin edilen regresyon model parametreleri, k iterasyon sayısı ve 0ε >
olmak üzere çok küçük bir sayıdır.
44
3. OTOMOBĐL BEĞENĐ DEĞERĐ FONKSĐYONUNUN
BELĐRLENMESĐNDE DÖRT TEKNĐĞĐN KARŞILAŞTIRILMASI
Çoklu Doğrusal Regresyon Analizi ile bulunan modelin diğer üç teknikle
(Robust Regresyon Analizi, Fuzzy Regresyon Analizi, Fuzzy Robust Regresyon
Analizi) nasıl sonuç verdiği otomobil beğeni değerleri için, gözlenen 45 otomobil
markası verileriyle denenmiştir. Çoklu doğrusal regresyon çalışmasında Otomobil
Beğeni Değeri’ni açıklamada sekiz açıklayıcı değişken olarak otomobil’in fiyatı, silindir
hacmi, beygir gücü, maksimum hız, saniyede 0’dan 100 km/saat’e çıkma süresi, 100
kilometrede şehir dışı kaç litre yaktığı, 100 kilometrede şehir içinde kaç litre yaktığı ve
bir kilometre gitmenin maliyeti belirlenmiştir. Aynı değişkenlerle diğer üç tekniğin nasıl
sonuç vereceği araştırılmıştır.
1X , 2X , 3X , 4X , 5X , 6X , 7X , 8X ,ve Y değerleri;
1X : Otomobilin Fiyatını’nı (TL),
2X : Otomobilin Silindir Hacmi’nı (cc),
3X : Otomobilin Beygir Gücü’nü (HP),
4X : Otomobilin Maksimum Hızı’nı (km/saat),
5X : Otomobilin Saniyede 0’dan 100 km/saat’e Çıkma Süresi’ni (saniye),
6X : Otomobilin 100 Kilometrede Şehir Dışında Kaç Litre Yaktığı’nı (litre),
7X : Otomobilin 100 Kilometrede Şehir Đçinde Kaç Litre Yaktığı’nı (litre),
8X : Otomobilin Bir Kilometre Gitmesinin Maliyeti’ni
6 7(( ) / 2).
100 10000 15000 15000 25000 30000
X X Yakıt Fiyatı Bakım Ücreti Yıllık Vergi Trafik Sigortası
veya veya veya
+ ++ +
Y : Otomobil Beğeni Değeri’ni ([ ]0 10− aralığı üzerinden) ifade etmektedir.
45
Fuzzy hedef çıktısı ( iY ) aşağıdaki şekilde oluşturulmuştur:
1 2 3 4 5 6 7 8( , , , , , , , , ), 1,..., 45 1,...,8.i j i i i i i i i iy f x x x x x x x x i j= = = (3.1)
Bir sonraki sayfada Tablo 1’deki s (spread) yayılım değerleri ise, gözlenen
otomobil beğeni değerinin minimum veya maksimum değerleri yardımıyla aşağıdaki
gibi hesaplanmıştır.
min maxi i i i is Y Y Y Y= − = − (3.2)
Ayrıca 'APE adında bir hata ölçütü tanımlanmıştır. 61
'APE ne kadar küçükse tahmin değerleri o denli başarılı olduğunu
söyleyebiliriz.
1
1'
i iN
i i
Y YAPE
N Y
∧
=
−= ∑ , (3.3)
61 Cheng C., Lee E. S., “Fuzzy Regression with Radial Basis Function Network”, Fuzzy
Sets and Syatems 119 (2001), s:29
46
Tablo 1: Girdi Değişken Verileri ve Hedef Çıktılar n X1 X2 X3 X4 X5 X6 X7 X8 Ymin Y Ymax s
1 57997,768 1598 122 203 7,6 4,8 7,6 0,40 7,0 7,35 7,7 0,4 2 44600 1290 124 185 11,9 5,9 9 0,43 7,9 8,1 8,3 0,2 3 96173,64 1480 156 230 9,5 5,7 9,9 0,53 4,6 6,45 8,3 1,9 4 60642,512 1390 122 203 8,9 4,4 6,8 0,43 7,3 7,55 7,8 0,3 5 28170 1390 85 174 12,3 5,3 8,6 0,42 7,2 7,45 7,7 0,3 6 46600 1598 120 190 10,9 5,3 9,6 0,41 7,5 7,85 8,2 0,4 7 55980 1368 120 195 9,4 5,4 8,6 0,41 8,1 8,2 8,3 0,1 8 93169 1956 160 218 9,5 4,7 7,7 0,41 7,6 7,75 7,9 0,2 9 33908 1598 124 190 10,9 5,1 8,8 0,39 7,7 7,95 8,2 0,3 10 23900 1086 69 156 15 4,1 5,8 0,28 7,5 7,75 8,0 0,3 11 27516 1206 81 164 12,1 4,2 6,6 0,31 7,3 7,65 8,0 0,4 12 37175 1368 120 197 9,6 5,5 8,6 0,40 7,2 7,35 7,5 0,2 13 57730 1598 156 204 10,9 5,4 8,8 0,42 7,4 7,45 7,5 0,0 14 33900 1396 108 185 11,5 4,8 7,8 0,36 7,6 7,8 8,0 0,2 15 48163 1398 140 202 9,9 4,7 7,8 0,37 7,3 7,45 7,6 0,2 16 55000 1598 120 203 11,5 4,6 9 0,39 7,1 7,4 7,7 0,3 17 39800 1197 105 187 10,9 4,9 7,1 0,34 8,0 8,1 8,2 0,1 18 29282 1240 80 167 13,5 5,1 7,4 0,35 7,0 7,35 7,7 0,4 19 61700 1390 122 205 10,3 5,2 7,3 0,38 7,5 7,65 7,8 0,1 20 29904 1368 77 165 13,2 5 7,5 0,36 7,5 7,6 7,7 0,1 21 39100 1582 90 172 13,8 4,2 5,7 0,29 7,7 7,9 8,1 0,2 22 23990 1248 74 170 16 4 6,4 0,26 7,1 7,4 7,7 0,3 23 48900 1364 90 175 11,9 4,0 5,6 0,29 7,9 8,1 8,3 0,2 24 42600 1598 90 180 11,5 3,7 5,2 0,26 7,3 7,5 7,7 0,2 25 59700 1560 112 190 12,8 4,5 6,4 0,32 7,5 7,55 7,6 0,0 26 44170 1598 105 190 11,8 3,9 5,7 0,29 7,8 7,9 8,0 0,1 27 56850 1461 110 182 12,5 4,4 6,1 0,31 7,1 7,2 7,3 0,1 28 61578 1598 105 185 11,3 3,7 5,5 0,28 8,1 8,2 8,3 0,1 29 55300 1598 105 190 11,7 4,2 5,6 0,29 7,8 7,95 8,1 0,2 30 44600 1595 102 188 11,3 5,5 8,8 0,37 7,5 7,75 8,0 0,3 31 37200 1598 90 178 11,8 3,6 5,1 0,26 7,2 7,3 7,4 0,1 32 39430 1560 90 173 13,4 4,1 6,1 0,28 7,0 7,25 7,5 0,3 33 39300 1598 110 183 11,7 5,3 8,8 0,36 7,6 7,8 8,0 0,2 34 56019 1248 95 170 14,7 3,6 5,1 0,25 7,3 7,45 7,6 0,2 35 37050 1598 110 185 11,7 5,3 8,8 0,36 7,1 7,2 7,3 0,1 36 48700 1461 105 185 10,9 4 5,5 0,28 7,1 7,2 7,3 0,1 37 80600 1598 200 237 7,5 5,6 9,1 0,43 8,0 8,25 8,5 0,3 38 72649,6 1390 160 218 8 5,4 8,7 0,43 7,8 8,15 8,5 0,4 39 49600 1560 156 214 7,3 5,1 9,4 0,41 7,5 7,85 8,2 0,4 40 39970 1197 105 175 11,8 5,9 7,9 0,39 7,7 7,85 8,0 0,2 41 47750 1598 120 195 11,6 5,6 9,8 0,44 7,4 7,65 7,9 0,3 42 34400 1598 105 160 12,8 7 10,4 0,48 7,7 8,1 8,5 0,4 43 75900 1987 158 185 11 6,5 9,6 0,53 7,4 7,7 8,0 0,3 44 28370 1198 70 158 15,9 5,5 8,7 0,39 7,5 7,7 7,9 0,2
45 42750 1591 125 178 12,2 5,8 9 0,41 7,7 7,9 8,1 0,2
Kaynak: Otohaber Test Yıllığı 2011, Auto Show Dergisi Sayı:26, car.tr.diploptop.com ( min maxi i i i is Y Y Y Y= − = − )
47
3.1. Regresyon Analizi
Gözlem değerleri ile Bölüm 2.1‘de açıklanan Çoklu Doğrusal Regresyon
Analizi çalışması SPSS programıyla yapılmış ve aşağıdaki sonuçlar bulunmuştur.
Çıktıya baktığımızda oluşturulan regresyon denkleminin
1 3 4 5 6 7 811.645 2.348 6 0.009 0.019 0.101 0.233 0.042 4.589Y E X X X X X X X∧
= + − + − − + + −
olduğunu ve 2R ’nin 0.268 olduğunu görmekteyiz. Bu sonuca göre, bağımlı
değişkendeki %26.8’lik değişim modele dahil ettiğimiz bağımsız değişkenler tarafından
açıklanmaktadır. ANOVA tablosuna baktığımızda, tablodaki 1.643 F değeri,
modelimizin bir bütün olarak anlamlı olmadığını göstermektedir (Sig.=0.147>0.05).
48
Katsayılar tablosunda 0β , 1β , 2β , 3β , 4β , 5β , 6β , 7β , 8β için bulunan 0b , 1b ,
2b , 3b , 4b , 5b , 6b , 7b , 8b istatistikleri kullanılarak 0 0: 0H β = , 0 1: 0H β = , 0 2: 0H β = ,
0 3: 0H β = , 0 4: 0H β = , 0 5: 0H β = , 0 6: 0H β = , 0 7: 0H β = , 0 8: 0H β = hipotezleri
için sınama sonuçları görülmektedir. 0 0: 0H β = hipotezi için elde edilen sig. değeri
dışında diğer hipotezler için elde edilen sig. değeri %5 ’den büyük çıkmıştır. Sonuç
olarak 0 0: 0H β = hipotezi %95 güven düzeyinde reddedilmiş, hesaplanan istatistiğin
sıfır olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven düzeyinde
reddedilememiş, hesaplanan istatistiklerin sıfır olduğu belirlenmiştir. Modelin bir bütün
olarak anlamlı bulunmamasından ve en az bir bağımsız değişkenin anlamlı
bulunmamasından dolayı elimizdeki veri seti için çoklu doğrusal regresyon analizinin
uygun olmadığına karar verilmiştir.
3.2. Robust Regresyon Analizi
3.2.1. LMS (Least Median of Squares) Kestiricisi Yöntemi ve RLS
Bu analizde, veri seti üzerine, Bölüm 2.2.2.1.2. ‘de açıklanan LMS Kestirme
Yöntemi ve LMS’ye dayalı yeniden ağırlıklandırılmış EKK Yöntemi (RLS) SAS/IML
programı ile yapılmış ve aşağıdaki sonuçlar bulunmuştur.
49
Çıktıya baktığımızda oluşturulan regresyon denkleminin
1 2 3 4 5 6 7 86.45 1.52 5 8.65 04 0.015 0.00295 0.021 0.413 0.074 2.069Y E X E X X X X X X X∧
= − − − − + + + + − −
olduğunu ve Robut 2R ’nin 0.52 olduğunu görmekteyiz. Bu sonuca göre, bağımlı
değişkendeki %52’lik değişim, modele dahil ettiğimiz bağımsız değişkenler tarafından
açıklanmaktadır.
50
Tablo 2: Girdi Değişken Verileri, Hedef Çıktılar ve LMS’den Elde Edilen Y*, e
n X1 X2 X3 X4 X5 X6 X7 X8 Y Y* e
1 57997,768 1598 122 203 7,6 4,8 7,6 0,40 7,35 7,36 -0,01 2 44600 1290 124 185 11,9 5,9 9 0,43 8,1 8,20 -0,10 3 96173,64 1480 156 230 9,5 5,7 9,9 0,53 6,45 7,45 -1,00 4 60642,512 1390 122 203 8,9 4,4 6,8 0,43 7,55 7,36 0,19 5 28170 1390 85 174 12,3 5,3 8,6 0,42 7,45 7,55 -0,10 6 46600 1598 120 190 10,9 5,3 9,6 0,41 7,85 7,57 0,28 7 55980 1368 120 195 9,4 5,4 8,6 0,41 8,2 7,74 0,46 8 93169 1956 160 218 9,5 4,7 7,7 0,41 7,75 7,12 0,63 9 33908 1598 124 190 10,9 5,1 8,8 0,39 7,95 7,85 0,10 10 23900 1086 69 156 15 4,1 5,8 0,28 7,75 7,65 0,10 11 27516 1206 81 164 12,1 4,2 6,6 0,31 7,65 7,55 0,10 12 37175 1368 120 197 9,6 5,5 8,6 0,40 7,35 8,10 -0,75 13 57730 1598 156 204 10,9 5,4 8,8 0,42 7,45 8,07 -0,62 14 33900 1396 108 185 11,5 4,8 7,8 0,36 7,8 7,79 0,01 15 48163 1398 140 202 9,9 4,7 7,8 0,37 7,45 8,00 -0,55 16 55000 1598 120 203 11,5 4,6 9 0,39 7,4 7,29 0,11 17 39800 1197 105 187 10,9 4,9 7,1 0,34 8,1 7,96 0,14 18 29282 1240 80 167 13,5 5,1 7,4 0,35 7,35 7,74 -0,39 19 61700 1390 122 205 10,3 5,2 7,3 0,38 7,65 7,78 -0,13 20 29904 1368 77 165 13,2 5 7,5 0,36 7,6 7,49 0,11 21 39100 1582 90 172 13,8 4,2 5,7 0,29 7,9 7,36 0,54 22 23990 1248 74 170 16 4 6,4 0,26 7,4 7,59 -0,19 23 48900 1364 90 175 11,9 4,0 5,6 0,29 8,1 7,28 0,82 24 42600 1598 90 180 11,5 3,7 5,2 0,26 7,5 7,16 0,34 25 59700 1560 112 190 12,8 4,5 6,4 0,32 7,55 7,42 0,13 26 44170 1598 105 190 11,8 3,9 5,7 0,29 7,9 7,38 0,52 27 56850 1461 110 182 12,5 4,4 6,1 0,31 7,2 7,50 -0,30 28 61578 1598 105 185 11,3 3,7 5,5 0,28 8,2 7,04 1,16 29 55300 1598 105 190 11,7 4,2 5,6 0,29 7,95 7,33 0,62 30 44600 1595 102 188 11,3 5,5 8,8 0,37 7,75 7,57 0,18 31 37200 1598 90 178 11,8 3,6 5,1 0,26 7,3 7,20 0,10 32 39430 1560 90 173 13,4 4,1 6,1 0,28 7,25 7,30 -0,05 33 39300 1598 110 183 11,7 5,3 8,8 0,36 7,8 7,70 0,10 34 56019 1248 95 170 14,7 3,6 5,1 0,25 7,45 7,34 0,11 35 37050 1598 110 185 11,7 5,3 8,8 0,36 7,2 7,74 -0,54 36 48700 1461 105 185 10,9 4 5,5 0,28 7,2 7,47 -0,27 37 80600 1598 200 237 7,5 5,6 9,1 0,43 8,25 8,44 -0,19 38 72649,6 1390 160 218 8 5,4 8,7 0,43 8,15 8,05 0,10 39 49600 1560 156 214 7,3 5,1 9,4 0,41 7,85 8,04 -0,19 40 39970 1197 105 175 11,8 5,9 7,9 0,39 7,85 8,19 -0,34 41 47750 1598 120 195 11,6 5,6 9,8 0,44 7,65 7,64 0,01 42 34400 1598 105 160 12,8 7 10,4 0,48 8,1 7,98 0,12 43 75900 1987 158 185 11 6,5 9,6 0,53 7,7 7,61 0,09 44 28370 1198 70 158 15,9 5,5 8,7 0,39 7,7 7,65 0,05
45 42750 1591 125 178 12,2 5,8 9 0,41 7,9 7,96 -0,06
51
1
1' 0.038
i iN
i i
Y YAPE
N Y
∧
=
−= ≅∑ olarak hesaplanmıştır.
Bu tabloda, 0β , 1β , 2β , 3β , 4β , 5β , 6β , 7β , 8β için bulunan 0b , 1b , 2b , 3b ,
4b , 5b , 6b , 7b , 8b istatistikleri kullanılarak 0 0: 0H β = , 0 1: 0H β = , 0 2: 0H β = ,
0 3: 0H β = , 0 4: 0H β = , 0 5: 0H β = , 0 6: 0H β = , 0 7: 0H β = , 0 8: 0H β = hipotezleri
için sınama sonuçları görülmektedir. 0 0: 0H β = hipotezi için elde edilen t değeri
dışında diğer hipotezler için elde edilen t değeri %5’den büyük çıkmıştır. Sonuç
olarak 0 0: 0H β = hipotezi %95 güven düzeyinde reddedilmiş, hesaplanan istatistiğin
sıfır olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven düzeyinde
reddedilememiş, hesaplanan istatistiklerin sıfır olduğu belirlenmiştir. LMS’ye dayalı
yeniden ağırlıklandırılmış EKK Yöntemi (RLS) ile anlamlı bir model kurulamamıştır.
52
3.2.2. LTS (Least Trimmed Squares) Kestiricisi Yöntemi ve RLS
Bu analizde, veri seti üzerine, Bölüm 2.2.2.1.4. ‘de açıklanan LTS Kestirme
Yöntemi ve LTS’ye dayalı yeniden ağırlıklandırılmış EKK Yöntemi (RLS) SAS/IML
programı ile yapılmış ve aşağıdaki sonuçlar bulunmuştur.
Çıktıya baktığımızda oluşturulan regresyon denkleminin
1 2 3 4 5 6 7 811.93 3.885 7 9.845 04 0.01 0.0154 0.124 0.218 0.107 3.98Y E X E X X X X X X X∧
= − − − − − − − + + −
olduğunu ve Robut 2R ’nin 0.79 olduğunu görmekteyiz. Bu sonuca göre, bağımlı
değişkendeki %79’lik değişim, modele dahil ettiğimiz bağımsız değişkenler tarafından
açıklanmaktadır.
53
Tablo 3: Girdi Değişken Verileri, Hedef Çıktılar ve LTS’den Elde Edilen Y*, e
n X1 X2 X3 X4 X5 X6 X7 X8 Y Y* e
1 57997,768 1598 122 203 7,6 4,8 7,6 0,40 7,35 7,74 -0,39 2 44600 1290 124 185 11,9 5,9 9 0,43 8,1 8,11 -0,01 3 96173,64 1480 156 230 9,5 5,7 9,9 0,53 6,45 7,47 -1,02 4 60642,512 1390 122 203 8,9 4,4 6,8 0,43 7,55 7,49 0,06 5 28170 1390 85 174 12,3 5,3 8,6 0,42 7,45 7,60 -0,15 6 46600 1598 120 190 10,9 5,3 9,6 0,41 7,85 7,80 0,05 7 55980 1368 120 195 9,4 5,4 8,6 0,41 8,2 8,06 0,14 8 93169 1956 160 218 9,5 4,7 7,7 0,41 7,75 7,26 0,49 9 33908 1598 124 190 10,9 5,1 8,8 0,39 7,95 7,81 0,14 10 23900 1086 69 156 15 4,1 5,8 0,28 7,75 7,70 0,05 11 27516 1206 81 164 12,1 4,2 6,6 0,31 7,65 7,91 -0,26 12 37175 1368 120 197 9,6 5,5 8,6 0,40 7,35 8,09 -0,74 13 57730 1598 156 204 10,9 5,4 8,8 0,42 7,45 7,84 -0,39 14 33900 1396 108 185 11,5 4,8 7,8 0,36 7,8 7,79 0,01 15 48163 1398 140 202 9,9 4,7 7,8 0,37 7,45 7,97 -0,52 16 55000 1598 120 203 11,5 4,6 9 0,39 7,4 7,38 0,02 17 39800 1197 105 187 10,9 4,9 7,1 0,34 8,1 8,03 0,07 18 29282 1240 80 167 13,5 5,1 7,4 0,35 7,35 7,76 -0,41 19 61700 1390 122 205 10,3 5,2 7,3 0,38 7,65 7,72 -0,07 20 29904 1368 77 165 13,2 5 7,5 0,36 7,6 7,61 -0,01 21 39100 1582 90 172 13,8 4,2 5,7 0,29 7,9 7,28 0,62 22 23990 1248 74 170 16 4 6,4 0,26 7,4 7,35 0,05 23 48900 1364 90 175 11,9 4,0 5,6 0,29 8,1 7,62 0,48 24 42600 1598 90 180 11,5 3,7 5,2 0,26 7,5 7,39 0,11 25 59700 1560 112 190 12,8 4,5 6,4 0,32 7,55 7,36 0,19 26 44170 1598 105 190 11,8 3,9 5,7 0,29 7,9 7,33 0,57 27 56850 1461 110 182 12,5 4,4 6,1 0,31 7,2 7,59 -0,39 28 61578 1598 105 185 11,3 3,7 5,5 0,28 8,2 7,42 0,78 29 55300 1598 105 190 11,7 4,2 5,6 0,29 7,95 7,37 0,58 30 44600 1595 102 188 11,3 5,5 8,8 0,37 7,75 7,74 0,01 31 37200 1598 90 178 11,8 3,6 5,1 0,26 7,3 7,33 -0,03 32 39430 1560 90 173 13,4 4,1 6,1 0,28 7,25 7,37 -0,12 33 39300 1598 110 183 11,7 5,3 8,8 0,36 7,8 7,83 -0,03 34 56019 1248 95 170 14,7 3,6 5,1 0,25 7,45 7,52 -0,07 35 37050 1598 110 185 11,7 5,3 8,8 0,36 7,2 7,80 -0,60 36 48700 1461 105 185 10,9 4 5,5 0,28 7,2 7,69 -0,49 37 80600 1598 200 237 7,5 5,6 9,1 0,43 8,25 8,21 0,04 38 72649,6 1390 160 218 8 5,4 8,7 0,43 8,15 8,17 -0,02 39 49600 1560 156 214 7,3 5,1 9,4 0,41 7,85 8,22 -0,37 40 39970 1197 105 175 11,8 5,9 7,9 0,39 7,85 8,21 -0,36 41 47750 1598 120 195 11,6 5,6 9,8 0,44 7,65 7,62 0,03 42 34400 1598 105 160 12,8 7 10,4 0,48 8,1 8,06 0,04 43 75900 1987 158 185 11 6,5 9,6 0,53 7,7 7,66 0,04 44 28370 1198 70 158 15,9 5,5 8,7 0,39 7,7 7,60 0,10
45 42750 1591 125 178 12,2 5,8 9 0,41 7,9 7,94 -0,04
54
1
1' 0.033
i iN
i i
Y YAPE
N Y
∧
=
−= ≅∑ olarak hesaplanmıştır.
Bu tabloda, 0β , 1β , 2β , 3β , 4β , 5β , 6β , 7β , 8β için bulunan 0b , 1b , 2b , 3b ,
4b , 5b , 6b , 7b , 8b istatistikleri kullanılarak 0 0: 0H β = , 0 1: 0H β = , 0 2: 0H β = ,
0 3: 0H β = , 0 4: 0H β = , 0 5: 0H β = , 0 6: 0H β = , 0 7: 0H β = , 0 8: 0H β = hipotezleri
için sınama sonuçları görülmektedir. 0 0: 0H β = , 0 2: 0H β = , 0 5: 0H β = ve
0 8: 0H β = hipotezleri için elde edilen t değerleri dışında diğer hipotezler için elde
edilen t değerleri %5’den büyük çıkmıştır. Sonuç olarak 0 0: 0H β = , 0 2: 0H β = ,
0 5: 0H β = ve 0 8: 0H β = hipotezleri %95 güven düzeyinde reddedilmiş, hesaplanan
istatistiklerin sıfır olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven
düzeyinde reddedilememiş, hesaplanan istatistiklerin sıfır olduğu belirlenmiştir.
55
Bağımlı değişken üzerinde anlamlı bir etkisi bulunmayan 1X , 3X , 4X , 6X ,
7X değişenleri modelden çıkarıldığında elde edilen sonuç aşağıdaki gibidir.
Bu tabloda, 0β , 2β , 5β , 8β için bulunan 0b , 2b , 5b , 8b istatistikleri
kullanılarak 0 0: 0H β = , 0 2: 0H β = , 0 5: 0H β = , 0 8: 0H β = hipotezleri için sınama
sonuçları görülmektedir. 0 0: 0H β = hipotezi için elde edilen t değeri dışında diğer
hipotezler için elde edilen t değerleri %5’den büyük çıkmıştır. Sonuç olarak
0 0: 0H β = , hipotezi %95 güven düzeyinde reddedilmiş, hesaplanan istatistiğin sıfır
olamayacağı belirlenmiştir. Diğer hipotezler ise %95 güven düzeyinde reddedilememiş,
hesaplanan istatistiklerin sıfır olduğu belirlenmiştir. LTS’ye dayalı yeniden
ağırlıklandırılmış EKK Yöntemi (RLS) ile anlamlı bir model kurulamamıştır.
56
3.3. Fuzzy Regresyon Analizi
3.3.1. Tanaka Modeli Uygulaması
Bu analizde, veri seti üzerine, Bölüm 2.3.3.1. ‘de açıklanan Tanaka Yöntemi
hem Kesin Y değerleri için hem de Fuzzy (Bulanık) ( , )Y s değerleri için uygulanmıştır.
Çalışmada Lingo programı kullanılmış ve aşağıdaki sonuçlar bulunmuştur.
0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 1,2,...,45iY A A X A X A X A X A X A X A X A X i= + + + + + + + + =∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼
0 0 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 7 8 8 8( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , )
iY m s m s X m s X m s X m s X m s X m s X m s X m s X= + + + + + + + +∼
1,2,...,45i=
Tablo 4: Kesin ve Fuzzy Y için ( , )j jm s ’ler
0.5 için h =
Kesin Y için ( , )j jm s Fuzzy Y için ( , )j jm s
0
1
5
6
(7.36, 0)
(0, 0.24 04)
(0.0165, 0)
(0.01614, 0)
A
E A
A
A
⇒
− ⇒
⇒
⇒
0
1
2
5
6
(6.342, 0)
(0, 0.3801 04)
(0.6985 04, 0)
(0.0685, 0)
(0.04496, 0)
A
E A
E A
A
A
⇒
− ⇒
− ⇒
⇒
⇒
.
Tabloya baktığımızda Kesin Y değerleri ile kurulan modelde
2 3 4 7 8, , , ,X X X X X değişkenlerinin modelde olmadığı görülmektedir. Fuzzy Y değerleri
ile kurulan modelde ise 3 4 7 8, , ,X X X X değişkenlerinin modelde olmadığı
görülmektedir. Y değerlerini fuzzy olarak ele aldığımızda 2X değişkeninin modele dahil
olduğunu görmekteyiz. Kurulan modeller:
Kesin Y için: ~
1 5 6(7.36, 0) (0, 0.24 04) (0.0165, 0) (0.01614, 0)iY E X X X= + − + +
Fuzzy Y için: ~
1 2 5 6(6.342, 0) (0, 0.3801 04) (0.6985 04, 0) (0.0685, 0) (0.04496, 0)iY E X E X X X= + − + − + +
57
Tablo 5: Kesin ve Fuzzy Y Đçin Tahmini Değerler (Y*), FR1 FR2 Đstatistikleri
Kesin Y için; Fuzzy Y için; .
Y Y* s* FR1 FR2 Y s Y* s* FR1 FR2
7,35 7,56 1,39 0,03 0,19 7,35 0,35 7,19 2,20 0,02 0,30 8,1 7,65 1,07 0,06 0,13 8,1 0,2 7,51 1,70 0,07 0,21 6,45 7,61 2,31 0,18 0,36 6,45 1,85 7,35 3,66 0,14 0,57 7,55 7,58 1,46 0,00 0,19 7,55 0,25 7,25 2,31 0,04 0,31 7,45 7,65 0,68 0,03 0,09 7,45 0,25 7,52 1,07 0,01 0,14 7,85 7,63 1,12 0,03 0,14 7,85 0,35 7,44 1,77 0,05 0,23 8,2 7,60 1,34 0,07 0,16 8,2 0,1 7,32 2,13 0,11 0,26 7,75 7,59 2,24 0,02 0,29 7,75 0,15 7,34 3,54 0,05 0,46 7,95 7,62 0,81 0,04 0,10 7,95 0,25 7,43 1,29 0,07 0,16 7,75 7,67 0,57 0,01 0,07 7,75 0,25 7,63 0,91 0,02 0,12 7,65 7,63 0,66 0,00 0,09 7,65 0,35 7,44 1,05 0,03 0,14 7,35 7,61 0,89 0,03 0,12 7,35 0,15 7,34 1,41 0,00 0,19 7,45 7,63 1,39 0,02 0,19 7,45 0,05 7,44 2,19 0,00 0,29 7,8 7,63 0,81 0,02 0,10 7,8 0,2 7,44 1,29 0,05 0,17 7,45 7,60 1,16 0,02 0,16 7,45 0,15 7,33 1,83 0,02 0,25 7,4 7,62 1,32 0,03 0,18 7,4 0,3 7,45 2,09 0,01 0,28 8,1 7,62 0,96 0,06 0,12 8,1 0,1 7,39 1,51 0,09 0,19 7,35 7,67 0,70 0,04 0,10 7,35 0,35 7,58 1,11 0,03 0,15 7,65 7,61 1,48 0,00 0,19 7,65 0,15 7,38 2,35 0,04 0,31 7,6 7,66 0,72 0,01 0,09 7,6 0,1 7,57 1,14 0,00 0,15 7,9 7,66 0,94 0,03 0,12 7,9 0,2 7,59 1,49 0,04 0,19 7,4 7,69 0,58 0,04 0,08 7,4 0,3 7,71 0,91 0,04 0,12 8,1 7,62 1,17 0,06 0,14 8,1 0,2 7,43 1,86 0,08 0,23 7,5 7,61 1,02 0,01 0,14 7,5 0,2 7,41 1,62 0,01 0,22 7,55 7,64 1,43 0,01 0,19 7,55 0,05 7,53 2,27 0,00 0,30 7,9 7,62 1,06 0,04 0,13 7,9 0,1 7,44 1,68 0,06 0,21 7,2 7,64 1,36 0,06 0,19 7,2 0,1 7,50 2,16 0,04 0,30 8,2 7,61 1,48 0,07 0,18 8,2 0,1 7,39 2,34 0,10 0,29 7,95 7,62 1,33 0,04 0,17 7,95 0,15 7,44 2,10 0,06 0,26 7,75 7,64 1,07 0,01 0,14 7,75 0,25 7,47 1,70 0,04 0,22 7,3 7,61 0,89 0,04 0,12 7,3 0,1 7,42 1,41 0,02 0,19 7,25 7,65 0,95 0,05 0,13 7,25 0,25 7,55 1,50 0,04 0,21 7,8 7,64 0,94 0,02 0,12 7,8 0,2 7,49 1,49 0,04 0,19 7,45 7,66 1,34 0,03 0,18 7,45 0,15 7,60 2,13 0,02 0,29 7,2 7,64 0,89 0,06 0,12 7,2 0,1 7,49 1,41 0,04 0,20 7,2 7,60 1,17 0,06 0,16 7,2 0,1 7,37 1,85 0,02 0,26 8,25 7,57 1,93 0,08 0,23 8,25 0,25 7,22 3,06 0,12 0,37 8,15 7,58 1,74 0,07 0,21 8,15 0,35 7,23 2,76 0,11 0,34 7,85 7,56 1,19 0,04 0,15 7,85 0,35 7,18 1,89 0,09 0,24 7,85 7,65 0,96 0,03 0,12 7,85 0,15 7,50 1,52 0,04 0,19 7,65 7,64 1,15 0,00 0,15 7,65 0,25 7,50 1,81 0,02 0,24 8,1 7,68 0,83 0,05 0,10 8,1 0,4 7,65 1,31 0,06 0,16 7,7 7,65 1,82 0,01 0,24 7,7 0,3 7,53 2,88 0,02 0,37 7,7 7,71 0,68 0,00 0,09 7,7 0,2 7,76 1,08 0,01 0,14
7,9 7,65 1,03 0,03 0,13 7,9 0,2 7,55 1,62 0,04 0,21
58
Kesin Y için: 1
1' 0.037
i iN
i i
Y YAPE
N Y
∧
=
−= ≅∑ ,
Fuzzy Y için: 1
1' 0.045
i iN
i i
Y YAPE
N Y
∧
=
−= ≅∑ olarak hesaplanmıştır.
Kesin Y için üyelik fonksiyonları;
0
0
0
1, =7,36 ( )
0, . .A
aa
ö dµ
=
∼ (3.5)
1
11
1
1 , - 0.24 - 04 0.24 04( ) 0.24 04
0 , . .A
aE a E
a Eö d
µ
− < < −= −
∼ (3.6)
5
5
5
1, 0.0165( )
0, . .A
aa
ö dµ
==
∼ (3.9)
6
6
6
1, 0.01614( )
0, . .A
aa
ö dµ
==
∼ (3.10)
1 , ( )
0 , . .
i
i i
i ii i i iYi
Y YY s Y Y sY
s
ö d
µ
∧
∧ ∧∧
− − − < < +=
(3.11)
olarak hesaplanmıştır.
59
Fuzzy Y için üyelik fonksiyonları;
0
20
1, 6.342( )
0, . .A
aa
ö dµ
==
∼ (3.12)
1
11
1
1 , - 0.3801 - 04 0.3801 04( ) 0.3801 04
0 , . .A
aE a E
a Eö d
µ
− < < −= −
∼ (3.13)
2
22
1, 0.6985 04( )
0, . .A
a Ea
ö dµ
= −=
∼ (3.14)
5
5
5
1, 0.0685( )
0, . .A
aa
ö dµ
==
∼ (3.15)
6
6
6
1, 0.04496( )
0, . .A
aa
ö dµ
==
∼ (3.16)
1 , ( )
0 , . .
i
i i
i ii i i iYi
Y YY s Y Y sY
s
ö d
µ
∧
∧ ∧∧
− − − < < +=
(3.18)
olarak hesaplanmıştır.
60
3.3.2. Fuzzy Lineer Regresyon Analizine EKK Yaklaşımı Uygulaması
Bu analizde, veri seti üzerine, Bölüm 2.3.7. ‘de açıklanan Fuzzy Lineer
Regresyon Analizine EKK Yaklaşımı Yöntemi uygulanmıştır. Çalışmada SAS/IML
programı kullanılmış ve aşağıdaki sonuçlar bulunmuştur.
( , )Y m s= , * * *( , )Y m s= (3.19)
cε+*m = m , *m = Xa (regresyon denklemi), (3.20)
rε+*s = s , b d+* *s = m 1 (yayılım regresyon denklemi) olmak üzere, (3.21)
* * 2 * 2( , ) ( ) ( )i i i i i i iY Y c c r rδ δ≡ = − + − ’dir. (3.22)
Amaç fonksiyonu şu şekilde tanımlanabilir:
2 * * * *
1
min ( ) '( ) ( ) '( )n
ii
c c c c r r r rδ=
= − − + − −∑ . (3.23)
Analizin sonucunda kestirilen katsayılar şunlardır:
Tablo 6: Kestirilen ja , b ve d
ja
0
1
2
3
4
5
6
7
8
10.34168
3.354 6
0.0000374
0.0083946
0.012231
0.066096
0.2118132
0.0222
3.653391
a
E a
a
a
a
a
a
a
a
⇒
− − ⇒
⇒
⇒
− ⇒
− ⇒
⇒
− ⇒
− ⇒
0.990758b = − , 7.8380299d = .
: 65086Đterasyon sayısı
.
61
Tablo 7: m , *m ve s , *s Değerleri
( , )Y m s= , * * *( , )Y m s=
m m* s s*
7,35 7,63 0,35 0,28 8,1 7,71 0,2 0,20 6,45 6,99 1,85 0,91 7,55 7,35 0,25 0,55 7,45 7,47 0,25 0,44 7,85 7,62 0,35 0,29 8,2 7,66 0,1 0,25 7,75 7,48 0,15 0,43 7,95 7,74 0,25 0,17 7,75 7,70 0,25 0,21 7,65 7,78 0,35 0,13 7,35 7,74 0,15 0,17 7,45 7,72 0,05 0,19 7,8 7,69 0,2 0,22 7,45 7,75 0,15 0,16 7,4 7,33 0,3 0,57 8,1 7,76 0,1 0,14 7,35 7,66 0,35 0,24 7,65 7,57 0,15 0,33 7,6 7,63 0,1 0,28 7,9 7,71 0,2 0,20 7,4 7,55 0,3 0,36 8,1 7,72 0,2 0,19 7,5 7,77 0,2 0,14 7,55 7,61 0,05 0,30 7,9 7,67 0,1 0,24 7,2 7,74 0,1 0,17 8,2 7,71 0,1 0,20 7,95 7,71 0,15 0,20 7,75 7,68 0,25 0,23 7,3 7,77 0,1 0,14 7,25 7,73 0,25 0,18 7,8 7,79 0,2 0,12 7,45 7,68 0,15 0,23 7,2 7,78 0,1 0,13 7,2 7,83 0,1 0,08 8,25 7,83 0,25 0,08 8,15 7,68 0,35 0,23 7,85 7,82 0,35 0,09 7,85 7,86 0,15 0,05 7,65 7,46 0,25 0,45 8,1 7,86 0,4 0,05 7,7 7,73 0,3 0,18 7,7 7,44 0,2 0,46
7,9 7,85 0,2 0,06
62
1
1' 0.0335
i iN
i i
Y YAPE
N Y
∧
=
−= ≅∑ olarak hesaplanmıştır.
3.4. Fuzzy Robust Regresyon Analizi
Bu bölümde veri seti, Bölüm 2.4.1.’de açıklanan M-Kestiricisi’ne Dayanan
Fuzzy Robust Regresyon Analizi Yöntemi ile hem Kesin Y değerleri için hem de Fuzzy
Y değerleri için Fuzzy Robust Regresyon Analizi’ne tabi tutulmuştur. Fuzzy Y değerleri
ile yapılan analizde uygun bir sonuç bulunamamıştır. Analiz Lingo programı ile
yapılmış ve aşağıdaki sonuçlar bulunmuştur.
0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8iY A A X A X A X A X A X A X A X A X= + + + + + + + +∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼ ∼
(3.24)
01 02 03 11 12 13 1 21 22 23 2 81 82 83 8( , , ) ( , ) ( , ) ... ( , )iY a a a a a a X a a a X a a a X= + + + +∼
(3.25)
Tablo 8: Kesin Y için 1 2 3( , , )j j ja a a ’ler
0 için h =
Kesin Y için 1 2 3( , , )j j ja a a :
0
1
2
3
4
5
6
7
8
(0, 0, 0)
(0.928 04, 0.943 04, 0.943 04)
(0, 0.127 03, 0.127 03)
(0, 0, 0)
(0, 0.406 02, 0.406 02)
(0, 0, 0)
(0.234, 0.234, 0.234)
(0, 0, 0)
(7.972, 7.972, 7.972)
A
E E E A
E E A
A
E E A
A
A
A
A
⇒
− − − ⇒
− − ⇒
⇒
− − ⇒
⇒
⇒
⇒
⇒
.
63
Tablo 9: 2 3 5 6, , ,A A A A Analizden Çıkartıldığında
Kesin Y için 1 2 3( , , )j j ja a a ’ler
0 için h =
Kesin Y için 1 2 3( , , )j j ja a a :
1
2
4
6
8
(0.928 04, 0.943 04, 0.943 04)
(0, 0.127 03, 0.127 03)
(0, 0.406 02, 0.406 02)
(0.234, 0.234, 0.234)
(7.972, 7.972, 7.972)
E E E A
E E A
E E A
A
A
− − − ⇒
− − ⇒
− − ⇒
⇒
⇒
.
Oluşturulan model:
Kesin Y için:
1 2
4 7
8
(0.928 04,0.943 04,0.943 04) (0,0.127 03,0.127 03)
(0,0.406 02,0.406 02) (0.234,0.234,0.234)
(7.972,7.972,7.972)
iY E E E X E E X
E E X X
X
= − − − + − −
+ − − +
+
∼
(3.26)
’dir.
64
Üyelik fonksiyonları:
1
1 , 0.928 04( )
0 , .A
a Ea
ö dµ
= −=
(3.27)
2
, 0 0.127 03( ) 0.127 03
0 , . .A
aa E
a Eö d
µ ≤ ≤ −
= −
(3.28)
4
, 0 0.406 02( ) 0.406 02
0 , . .A
aa E
a Eö d
µ ≤ ≤ −
= −
(3.29)
6
1 , 0.234( )
0 , .A
aa
ö dµ
==
(3.30)
8
1 , 7.972( )
0 , .A
aa
ö dµ
==
(3.31)
*
1 6 8
2
1 2 4
0 , 0.928 04 0.234 7.972
8.211 , 0 0.127 03 0
0.15 05 0.127 03 0.406 02( )i
i i i
i
i i iY
y E x x x
yy E x
E x E x E xyµ
< − + +
−− ≤ ≤+ − +
− + − + −=4
1 2
.406 02
0 , 0.943 04 0.127 03
i
i i
E x
y E x E x
−
> − + −
4 6 8 0.406 02 0.234 7.972i i iE x x x+ − + +
(3.32)
65
Tablo 10: Gözlenen Y ve Tahmin Edilen Y* Değerleri
Y Y*min Y* Y*max
7,35 9,7 10,8 10,8 8,1 8,9 9,9 9,9 6,45 14,5 15,7 15,7 7,55 10,1 11,2 11,2 7,45 7,2 8,1 8,1 7,85 8,9 9,9 9,9 8,2 9,7 10,8 10,8 7,75 13,0 14,3 14,3 7,95 7,4 8,5 8,5 7,75 5,4 6,2 6,2 7,65 6,0 6,9 6,9 7,35 7,9 8,9 8,9 7,45 10,0 11,1 11,1 7,8 7,2 8,1 8,1 7,45 8,6 9,6 9,6 7,4 9,3 10,4 10,4 8,1 7,5 8,5 8,5 7,35 6,7 7,6 7,6 7,65 10,0 11,1 11,1 7,6 6,8 7,7 7,7 7,9 6,9 7,9 7,9 7,4 5,2 6,1 6,1 8,1 7,8 8,7 8,7 7,5 6,9 7,9 7,9 7,55 9,2 10,2 10,2 7,9 7,3 8,3 8,3 7,2 8,8 9,8 9,8 8,2 8,8 9,8 9,8 7,95 8,4 9,5 9,5 7,75 8,4 9,4 9,4 7,3 6,4 7,4 7,4 7,25 6,9 7,8 7,8 7,8 7,8 8,8 8,8 7,45 8,1 9,0 9,0 7,2 7,6 8,6 8,6 7,2 7,6 8,7 8,7 8,25 12,3 13,5 13,5 8,15 11,4 12,6 12,6 7,85 9,1 10,2 10,2 7,85 8,2 9,1 9,1 7,65 9,2 10,3 10,3 8,1 8,7 9,6 9,6 7,7 12,8 13,9 13,9 7,7 7,0 7,9 7,9
7,9 8,6 9,6 9,6
66
Y*
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
16,0
18,0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45
Y*
Şekil 3.1. Tahmin Edilen Y*’ların Görünümü
Y* değerlerini küçükten büyüğe doğru sıraladıktan sonra 1. ve 3. kartil
değerleri:
1
3
1 45 111.5 ' 8.1
4 43 1 3x45 1
34' 10.34 4
nQ uncu gözlem değeri
nQ üncü gözlem değeri
+ += = = =
+ += = = =
olarak hesaplanır. Bu değerlerden hareketle,
3 1( ) 10.3 8.1 2.2mjIQR r Q Q= − = − =
olarak bulunur. Sınırı aşan değerler için puanlama yöntemi,
1 31.5 x ( ) 4.8 veya 1.5 x ( ) 13.6 mj mjQ IQR r Q IQR r− = + =
şeklinde olacaktır. 4.8 değerinden daha düşük veya 13.6 değerinden daha büyük
değerler düzensiz çıktı verisi olarak adlandırılır. Şekil 3.1’e veya Tablo 10’a
baktığımızda, 15.7 değeriyle 3. tahmin değerinin, 14.3 değeriyle 8. tahmin değerinin ve
67
13.9 değeriyle 43. tahmin değerinin 13.6 değerini aştığını görmekteyiz. Bu tahmin
değerlerinin düzensiz çıktı verisi olduğunu söyleyebiliriz. Bu değerler,
i mi mim
i mi
y y rh
y y
−= =
işlemi ile elde edilen miy değeriyle değiştirilir.
Keyfi bir değer olan 0.45mh = için 3 9.35my = , 8 10.24my = ve 43 11.17my =
olarak hesaplanmıştır. Elde edilen son grafik:
Y*
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
16,0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45
Y*
Şekil 3.2. 3 8 43, ,m m my y y ile Birlikte Tahmin Edilen Y*’ların Görünümü
şeklindedir.
68
1
1' 0.23
i iN
i i
Y YAPE
N Y
∧
=
−= ≅∑ olarak hesaplanmıştır.
3.5. Karşılaştırma
Tablo 11: Dört Tekniğin Karşılaştırması
Regresyon Robust Regresyon Fuzzy Regresyon Fuzzy Robust Regresyon
LMS - RLS LTS - RLS Tanaka Đteratif EKK M Yöntemi
---- 0,038 - ---- 0,033 - ----
Kesin Y 0,037
Fuzzy Y 0.045 0,0335 0,23
---- 0,52 - ---- 0,79 - ---- ---- ---- ----
Tabloda görüldüğü üzere, Regresyon Analizi sonucunda anlamlı bir model
kurulamadığından 'APE ve 2R değerleri hesaplanamamıştır. LMS Yöntemi ile yapılan
Robust Regresyon Analizi sonucunda 'APE değeri ' 0.038APE = , 2R değeri
2 0.52R = olarak hesaplanmış, LMS’ye dayalı yeniden ağırlıklandırılmış EKK
Yöntemi’nde (RLS) anlamlı bir model kurulamadığından 'APE ve 2R değerleri
hesaplanamamıştır. Tanaka Modeli’nde Kesin Y girdi değerleri ile yapılan Fuzzy
Regresyon Analizi sonucunda 'APE değeri ' 0.037APE = olarak hesaplanmıştır.
Fuzzy Y girdi değerleri ile yapılan Analizde ise, 'APE değeri ' 0.045APE = olarak
hesaplanmıştır. Đteratif EKK Yaklaşımı ile yapılan Fuzzy Regresyon Analizi sonucunda
'APE değeri ' 0.0335APE = olarak hesaplanmıştır. M Yöntemine dayanan Fuzzy
Robust Regresyon Analizi sonucunda 'APE değeri ise ' 0.23APE = olarak
hesaplanmıştır.
'APE
2R
69
4. SONUÇ ve BULGULAR
Regresyon Analizi işletme, finans, ekonomi, ekonometri, tip, kimya, biyoloji
gibi çeşitli bilim alanlarında yoğun olarak kullanılmaktadır. Regresyon Analizi’nin
temelinde gözlenen bir olayın hangi olayların etkisi altında olduğunu araştırmak
yatmaktadır. Diğer bir ifade ile “Gözlenen bağımlı değişken hangi bağımsız değişken ya
da değişkenler tarafından ifade edilmektedir?” sorusuna yanıt aramaktır. Bu ilişki bir
model yardımı ile kurulmaktadır. Bu modelin adına regresyon modeli denilmektedir.
Robust Regresyon Analizi, Klasik Regresyon Analizi için gereken
varsayımların sağlanmadığı durumlarda, veri setinde aykırı değer ve/veya uç değer
olması durumlarında tercih edilen bir yöntemdir. Özellikle açıklanan değişkenin normal
dağılmadığı durumlarda başvurulan bir yöntemdir. Gerçek hayat verilerinde, özellikle
sosyal verilerde Klasik Regresyon Analizi için gereken varsayımların sağlanmadığı
görülebilmekte ve veri setinde aykırı ve/veya uç değer olabilmektedir. Böyle
durumlarda robust yöntemler tercih edilmekte ve Klasik Regresyon’a göre daha etkin
sonuçlar verdiği görülmektedir.
Fuzzy Regresyon Analizi, Klasik Regresyon’da modele eklenen hata terimiyle
gösterilen belirsizliği, regresyon parametrelerinin bulanıklığında göstermektedir.
Bağımlı değişken ile bağımsız değişken ya da değişkenler arasında kesin bir ilişki
kurulamadığı zaman ya da veri setindeki girdi değişkenlerinin ve/veya çıktı değerlerinin
bulanık olması durumunda tercih edilebilinir. Ek olarak Klasik Regresyon’da olduğu
gibi tek bir doğru ile bağımlı değişkeni açıklamak yerine, Fuzzy Regresyon’da alt ve
üst regresyon doğruları oluşturularak bağımlı değişkendeki toplam değişimi açıklama
oranını yükseltebiliriz. Son yıllarda özellikle finans alanında etkin bir şekilde bu
analizin kullanıldığı görülmektedir. Çeşitli karar mekanizmaları oluşturmak için bu
analizin yararlanılabilmektedir. Fuzzy Regresyon Analizi’nin dayandığı Bulanık Mantık
Kuramı ise günümüzde özellikle elektronikte uygulama alanı bulmaktadır.
Veri setinde aykırı ve/veya uç değerler olması durumunda Fuzzy Regresyon
Analizi ile kurulan modelin bulanıklığı artmaktadır. Bu bulanıklığı azaltmak için robust
yöntemler geliştirilmiş, geliştirilmektedir. Böyle durumlarda Fuzzy Robust Regresyon
70
Analizi tercih edilmektedir. Günümüzde geliştirilen çeşitli robust yaklaşım
algoritmalarıyla bu bulanıklık düşürülmeye çalışılmaktadır. Gerçek yaşam verilerinde
veri setinde aykırı ve/veya uç değerle karşılaşılmaktadır. Böyle durumlarda Fuzzy
Robust Regresyon Analizi’nin Fuzzy Regresyon Analizi’ne göre daha iyi sonuç verdiği
görülmektedir.
Bu tez kapsamında 45 otomobil markası teknik verileriyle otomobil beğeni
fonksiyonu oluşturulmaya çalışılmıştır.
Klasik Regresyon Analizi’nde En Küçük Kareler (EKK) Kestirim Yöntemiyle
kestirilen parametreler t sınamasından geçememiş ve anlamlı bir model
kurulamamıştır. Robust Regresyon Analizi’nde LMS Kestirim Yöntemiyle, 2 0.52R =
ve ' 0.038APE = olan,
1 2 3 4 5 6 7 86.45 1.52 5 8.65 04 0.015 0.00295 0.021 0.413 0.074 2.069Y E X E X X X X X X X∧
= − − − − + + + + − −modeli kurulmuştur. LMS’ye Dayalı Yeniden Ağırlıklandırılmış EKK Yöntemi
(RLS)’nde kestirilen regresyon parametreleri t sınamasından geçemediğinden anlamlı
bir model kurulamamıştır. LTS Kestirim Yöntemiyle, 2 0.79R = ve ' 0.033APE = olan,
1 2 3 4 5 6 7 811.93 3.885 7 9.845 04 0.01 0.0154 0.124 0.218 0.107 3.98Y E X E X X X X X X X∧
= − − − − − − − + + −
modeli kurulmuştur. LTS’ye Dayalı Yeniden Ağırlıklandırılmış EKK Yöntemi
(RLS)’nde kestirilen regresyon parametreleri t sınamasından geçemediğinden anlamlı
bir model kurulamamıştır. Robust Yöntemler Klasik Regresyon’a göre daha iyi sonuç
vermiştir.
Fuzzy Regresyon Analizi’nde Tanaka Modeli Uygulamasında Kesin Y girdi
değerleri ile oluşturulan model,
~
1 5 6(7.36, 0) (0, 0.24 04) (0.0165, 0) (0.01614, 0)iY E X X X= + − + + olup,
' 0.037APE = olarak hesaplanmıştır. Fuzzy Y girdi değerleri ile oluşturulan model ise,
~
1 2 5 6(6.342, 0) (0, 0.3801 04) (0.6985 04, 0) (0.0685, 0) (0.04496, 0)iY E X E X X X= + − + − + + olup,
' 0.045APE = olarak hesaplanmıştır. Đteratif EKK Yöntemi’nde ise 65086 iterasyon
sonucunda parametreler kestirilmiş ve elde edilen tahmini Y değerleri sonucunda 'APE
71
değeri, ' 0.0335APE = olarak hesaplanmıştır. Fuzzy Robust Regresyon Analizi’ne
baktığımızda M Yöntemi’ne Dayanan Fuzzy Robust Regresyon Analizi ile oluşturulan
modelin 'APE değeri, ' 0.23APE = olarak hesaplandığını görmekteyiz. Hem Tanaka
Modeli hem de Đteratif EKK Yöntemi ile yapılan Fuzzy Regresyon Analizi Fuzzy
Robust Regresyon Analizi’ne göre daha iyi sonuç verdiği söylenebilir.
Bu tez kapsamında Çoklu Regresyon Analizi’ne karşı diğer üç tekniğin
(Robust Regresyon Analizi, Fuzzy Regresyon Analizi, Fuzzy Robust Regresyon
Analizi) nasıl sonuç verdiği; tekniklerin birbirlerine karşı bir üstünlüklerinin olup
olmadığı incelenmiştir. Elde edilen sonuçlar, elimizdeki veri setinden yola çıkılarak
elde edilmiştir. Başka bir veri setinde (örneğin aykırı ve/veya uç değerlerin olduğu bir
veri seti) başka sonuçlar elde edilebilinecek, yaptığımız analizde üstün gelmeyen bir
teknik üstün gelebilecektir. Sonuç olarak bu tekniklerin birbirlerine karşı bir
üstünlüklerinin olmadığına, elimizdeki veri setinin yapısına göre her bir tekniğin
birbirine üstün gelebileceği saptanmıştır.
72
EKLER
EK 1. ANALĐZLERDE KULLANILAN OTOMOBĐL MARKALARI
n Marka
1 MINI Cooper 2 Toyota Corolla 1.6 A/T 3 Mercedes-Benz C 180 BlueEfficiency 4 Audi A1 1.4 TFSI S tronic 5 Skodia Fabia 1.4 6 Citroen DS3 1.6 Vti 120 HP 7 Alfa Romeo Giulietta 1.4 TB 8 Opel Insignia 2.0 CDTi 9 Chevrolet Cruze 1.6 10 Hyundai i10 1.1 Team A/T 11 Chevrolet Spark 1.2 LT 12 Fiat Bravo 1.4 T-Jet 13 Citroen C4 1.6 THP MCP 14 Hyundai Accent Blue 1.4 15 Opel Astra 1.4 HB Turbo 16 Peugeot 508 1.6 Vti Auto 6R 17 Seat Leon 1.2 TSI 18 Nissan Micra 1.2 CVT 19 Volkswagen Passat 1.4 TSI DGS 20 Fiat Punto Evo 1.4 Fire 21 Kia cee'd 1.6 CRDi 22 Tata Vista 1.3 CRDi Quadrojet 23 Toyota Corolla 1.4 D-4D 24 Volkswagen Polo 1.6 TDI 25 Citroen C5 1.6 Hdi 26 Skoda Octavia 1.6 TDI 27 Renault Latitude 1.5 dCi 28 Alfa Romeo Giulietta 1.6 JTD-2 29 Volkswagen Jetta 1.6 TDI DSG 30 Volkswagen Golf 1.6 TDI DSG 31 Seat Ibiza Sportourer 1.6 TDI 32 Citroen C3 1.6 Hdi 33 Renault Fluence 1.5 dCi EDC 34 Opel Astra HB 1.3 CDTi 35 Renault Megane HB dCi EDC 36 Renault Megane HB 1.5 dCi 37 Peugeot RCZ 1.6 HP 38 Volkswagen Scirocco 1.4 TSI DGS 39 Citroen DS3 1.6 THP 40 Skoda Yeti 1.2 TSI 41 Peugeot 3008 1.6 VTI 42 Dacia Duster 1.6 4x4 43 Toyota RAV4 2.0 Valvematic CVT 44 Skoda Roomster 1.2
45 Kia Venga 1.6 CVVT A/T
73
KAYNAKLAR
Alpar R., “Uygulamalı Çok Değişkenli Đstatistiksel Yöntemlere Giriş 1”, Nobel Yayın
Dağıtım, 2. Baskı, 2003
Altrock C. V., “Fuzzy Logic and NeuroFuzzy Applications in Business and Finance”,
Prentice Hall PTR, 1997
Andersen R., “Modern Methods for Robust Regression”, SAGE Publications, 2008
Başer F., “Aktüeryal Modellemede Melez Bulanık Regresyon Analizi”, Yüksek Lisans
Tezi, Ankara Üniversitesi, F.B.E., Đstatistik Ana Bilim Dalı, 2007
Bolatin A., “Fuzzy Logic Approach to Robust Regression Models of Uncertain Medical
Categories”, World Academy of Science, Engineering and Technology, 2006,s:106-111
Bolotin A., “Robustness of The Regression Models for Uncertain Categories”,
International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems Vol.15,
No.6 (2007) 681-695 © World Scientific Publishing Company
Buckley J. J., “Fuzzy Probability and Statistic”, Spinder, 2006
Chen C., “Robust Regression and Outlier Detection with The ROBUSTREG
Procedure”, SAS Institute Inc., Cary, NC, s:265-27
Cheng C., Lee E. S., “Fuzzy Regression with Radial Basis Function Network”, Fuzzy
Sets and Syatems 119 (2001), s:291-301
Cheng W. Y., Su E., Li S. J., “A Financial Distress Pre-Warning Study by Fuzzy
Regression Model of TSE-Listed Companies”, Asian Academy of Management Journal
of Accounting and Finance, Vol:2, No:2, 2006, s:75-93
Çağman N., “Bulanık Mantık”, Bilim ve Teknik, Vol:363, 2006, s:50-51, Haziran 2006
Çetin E., “Bulanık Mantık Denetleyiciler”, Seçkin Yayıncılık, 2003
74
D’Urso P., “Linear Regression Analysis for Fuzzy/Crisp Input and Fuzzy/Crisp Output
Data”, Computational Statistics & Data Analysis 42 (2003) 47-72
Davies P. L., “Aspects of Robust Linear Regression”, The Annals of Statistics 1993,
Vol.21, No.4, 1843-1899
Düzyurt S., “Bulanık Regresyon ile Tahmin ve Bir Uygulama”, Yüksek Lisans Tezi,
Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Endüstri Mühendisliği Ana Bilim Dalı,
Haziran 2008, Ankara
Erar A., “Bağlanım (Regreyon) Çözümlemesi, Ders Notları…”, MSGSÜ, Đstatistik,
Eylül 2006
Ergül B. “Robust Regresyon ve Uygulamaları”, Yüksek Lisans Tezi, Eskişehir
Osmangazi Üniversitesi, Fen Bilimleri Enstitüsü, Đstatistik Anabilim Dalı, Uygulamalı
Đstatistik Bilim Dalı, Temmuz 2006
Genceli M., “Ekonometri ve Đstatistik Đlkeleri”, Filiz Kitabevi, 2. Basım, 2001
Güneş M., Umarusman N., “Bir Karar Destek Aracı Bulanık Hedef Programlama ve
Yerel Yönetimlerde Vergi Optimizasyonu Uygulaması”, A Review of Social Economic
& Business Studies, Vol:2, s:242-255
Güneş M., “Bulanık Doğrusal Sistemler ve Regresyon Modellerine Uygulanması”, A
Review of Social Economic & Business Studies, Vol.1, No.1, Fall 2001, s:176-192
Hampel F., “Robust Statistic: A Brief Introduction and Overview”, Seminar für Statistik
Eidgenössische Technische Hochschule (ETH), Research Report No. 94, March 2001,
CH-8092 Zürich, Switzerland
Heikkila J., “Robust Regression”, Graduate Course on Advanced Statistical Signal
Processing, Information Processing Laboratory Department of Electrical Engineering P.
O. Box 4500, 90014 University of Oulu
75
Hellmann M., “Fuzzy Logic Introduction”, Laboratoire Antennes Radar Telecom, F.R.E
CNRS 2272, Equipe Radar Polarimetrie, Universit´e de Rennes 1, UFR S.P.M, Campus
de Beaulieu - Bat. 22, 263 Avenue General Leclerc, CS 74205, 35042 Rennes Cedex,
France
Hoaglin D. C., Mosteller F., Tukey J. W.,”Understanding Robust and Explonatory Data
Analysis”, New York: John Wiley & Sons, 1983
Hojati M., Bector C. R. Smimou K., “A Simple Method for Computation of Fuzzy
Linear Regression”, European Journal of Operational Research, 2004
Đnal H. C., Günay S., “ Olasılık ve Matematiksel Đstatistik”, Hacettepe Üniversitesi Fen
Fakültesi Yayınları, Beşinci Baskı, Ders Kitapları Dizini: 16, 2002
Kadilar C., Candan M., Cingi H., “Ratio Estimators Using Robust Regression”,
Hacettepe Journal of Mathematics and Statistics, Volume 36 (2) , 2007, s:181-188
Kalaycı Ş. “Spss Uygulamalı Çok Değişkenli Đstatistik Teknikleri”, Asil Yayın Dağıtım
Ltd. Şti., ISBN 975-9091-14-13, Birinci Baskı,2005
Kao C., Chyu C. L., “A Fuzzy Linear Regression Model with Beter Explanatory
Power”, Fuzzy Sets and Systems, 2002, s: 401-409
Kayhan Y., “Regresyon Çözümlemesinde Sağlam Konum Kestiricilerinin
Karşılaştırılması”, Yüksek Lisans Tezi, Hacettepe Üniversitesi, F.B.E., Đstatistik Ana
Bilim Dalı, 2006
Li J., Zheng M., “Robust Estimation of Multivariate Regression Model”, Regular
Article, Stat Papers (2009) 50:81-100 DOI 10.10007/s00362-007-0063-6
Maronna R. A., Martin R. D., Yohai V. J., “Robust Statistics : Theory and Methods”,
John Wiley & Sons, 2006
Martin R. D., Yohai V. J., Zamar R. H., “Min-Max Bias Robust Regression”, The
Annals of Statistics 1989, Vol.17 No.4, 1608-1630
76
Nasrabadi E., Hashemi S. M., “Robust Fuzzy Regression Analysis Using Neural
Networks”, International Journal of Uncertainty, Fuzziness and Knowledge-Based
Systems Vol.16, No.4 (2008) 579-598 © World Scientific Publishing Company
Nasrabadi M. M., Nasrabadi E., “ A mathematical-programming approach to Fuzzy
linear regression analysis” Applied Mathematics And Computation, 2004
Oğuzlar A., “Đstatistikel Veri Analizi SPSS ve Minitab Uygulamalı”, Ezgi Kitapevi
Yayınları, 1. Basım, Bursa, 2007
Olive D. J., “Applied Robust Statistics”, Southern Illinois University Department of
Mathematics, Mailcode 4408 Carbondale, IL 62901-4408, June 23, 2008
Önder A. Ö. “Least Median Squares : A Robust Regression Technique”, Ege Akademik
Bakış, Cilt:1, Sayı:1, 2001, s:185-191
Pearson K., Yule U., Blanchard N., Lee A. "The Law of Ancestral Heredity",
Biometrika, 1903
Peters G., “Fuzzy Linear Regression with Fuzzy Đntervals”, Fuzzy Sets and
Systems,1994
Ronchetti E., “Historical Development of Robust Statistics”, University of Geneva,
Switzerland, ICOTS-7, 2006
Rousseeuw P. J., Leroy A. M., “Robust Regression and Outlier Detection”, Jonh
Wiley & Sons, 2003
Rousseeuw P. J., Aelst S. V., Driessen K. V., Agullo J., “Robust Multivariate
Regression”, Technometrics; Aug 2004; 46,3; ABI/INFORM Global pg.293
Sanchez A. J., Gomez A. T., “Applications of Fuzzy Regression in Actuarial Analysis”,
The Journal of Risk and Insurance , 2003, Vol. 70, No. 4, 665-699
Serper Ö., “Uygulamalı Đstatistik II”, Ezgi Kitapevi, 4. Baskı, Kasım 2000
77
Shapiro A. F., “Fuzzy Regression Models”, Smeal College of Business, University Park,
PA 16802, USA
Sohn B. Y., “Robust Fuzzy Linear Regression Based on M-estimators”, J. App1. Math.
& Computing Vol:18, No:1-2, 2005, s:591-601
Şanlı K., Apaydın A., “The Fuzzy Robust Regression Analysis, The Case of Fuzzy Data
Has Outlier” G.Ü. Fen Bilimleri Dergisi, 2004, s:71-84
Şen Z., “Bulanık Mantık ve Modelleme Đlkeleri”, Bilge Kültür Sanat, 2001
Tatlıdil H., “Uygulamalı Çok Değişkenli Đstatistiksel Analiz”, Ziraat Matbaacılık A.Ş.,
Eylül 2002
Tekin N., Armutlulu Đ. H., “Bulanık Doğrusal Regresyonla Bazı Ekonometrik
Değişkenlerin Đncelenmesi ve Reel Efektif Döviz Kurunun Belirlenmesinde Ölçüm
Modeli Denemesi”, Sosyal Bilimler Dergisi, Cilt 1, Sayı:2, s:32-40, Mayıs 1994
Trafalis T. B., Ince Huseyin, “Support Vector Machine for Regression and Applications
to financial Forecasting”, School of Industrial Engineering, University of Oklahoma,
220 W. Boyd, Suite 124, Norman, Oklahoma 73019
Uras Y., “Bulanık Mantığın Doğrusal Regresyon Analizinde Kullanılmasına Đlişkin Bir
Uygulama”, Dokuz Eylül Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri Ana
Bilim Dalı, 1998, Đzmir
Vinod H. D., Ulah A., “Recent Advances in Regression Methods”, New York: Marcel
Dekker, 1981
Vural A., “Aykırı Değerlerin Regresyon Modellerine Etkileri ve Sağlam Kestiriciler”,
Yüksek Lisans Tezi, Marmara Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2007
Wang H. F., Tsaur R. C., “Resolution of Fuzzy regression model”, European Journal of
Operational Research, 2000, s:637-650
78
Watada J., Yabuuchi Y., “Fuzzy Robust Regression Analysis”, Department of Industrial
Management, Osaka Institute of Technology, 5-16-1 Omiya, Asahi, Osaka 535 Japan,
0-7803-1896-X/94 1994 IEEE
Wilcox R. R, “Fundamentals of Modern Statistical Methods, Substantially Improving
Power and Accuracy” Book Chapter 11: Robust Regression
Wieser A., Brunner F. K., “Robust Estimation Applied to Correlated GPS Phase
Observations”, Engineering Surveying and Metrology, Graz University of Technology,
Steyrergasse 30, 8010 Graz, Austria
Xu H., Caramanis C., Mannor S., “Robust Regression and Lasso”, IEEE Transactions
on Information Theory, Vol.56, No.7, July 2010
Yaffee R. A., “Robust Regression Analysis : Some Popular Statistical Package
Options”, Statistics Social Science, and Mapping Group Academic Computing Services,
Information Technology Services, December 2002
Yang M. S., Liu H. H., “Fuzzy Least-Squares Algorithms for Interactive Fuzzy Linear
Regression Models”, Fuzzy Sets and Systems 135 (2003) 305-316
Yorulmaz Ö., “Dayanıklı Regresyon Yöntemi ve Çeşitli Sosyal Veriler Üzerinde Aykırı
Gözlemlerin Teşhisi”, Balıkesir Üniversitesi, Sosyal Bilimler Enstitüsü Dergisi, Cilt:12,
Sayı 21, Haziran 2009, s:76-88
Yücel L. Đ., “Bulanık Regresyon : Türkiye’de 1980-2004 Döneminde Kayıt Dışı
Ekonominin Bulanık Yöntemlerle Tahminine Đlişkin Bir Uygulama”, Yüksek Lisans
Tezi, Đstanbul Üniversitesi, S.B.E., Ekonometri Ana Bilim Dalı, 2005
Zadeh L. A., “Fuzzy Locig=Computing With Words”, IEEE Transactions on Fuzzy
Systems, 1996