Lineer Regresyonla Model Oluşturma

27
Lineer Lineer Regresyonla Model Regresyonla Model Oluşturma Oluşturma

description

Lineer Regresyonla Model Oluşturma. Doğrusal Regresyonla Deneysel Model O luşturma. Regresyonda 1. Modelin denklemini belirle (en az parametreli uygun bir model ) 2. Modeli veriye uydur 3. Modelin uygunluğunu kontrol et. Uygun değil. uygun. M odeli Kullan. Madde miktarı. - PowerPoint PPT Presentation

Transcript of Lineer Regresyonla Model Oluşturma

Lineer Regresyonla Lineer Regresyonla Model Oluşturma Model Oluşturma

Doğrusal Regresyonla Deneysel Doğrusal Regresyonla Deneysel Model Model OOluşturmaluşturma

RegresyondaRegresyonda– 1. Modelin denklemini belirle (en az parametreli 1. Modelin denklemini belirle (en az parametreli

uygun bir modeluygun bir model))– 2. Modeli veriye uydur2. Modeli veriye uydur– 3. Modelin uygunluğunu kontrol et3. Modelin uygunluğunu kontrol et

uygun

Modeli Kullan

Uygun değil

Çökme tankında çöken katı oranı (R(z,t)) herhangi bir z yüksekliğinde t kalış zamanı ile:

derinlik

Katı Konsantrasyonu

)),((1

1

),(

),(000

0

0

z

z

dztzczCAzC

dztzcAAzC

tzR

C0

0

z

M = C0zA

Madde miktarı

Tank Taban Alanı

Katı Konsantrasyonu

C(z,t)

Çökme zamanı = t

0

z

z

dztzcAM0

),(

dz

Bu integral grafiksel olarak hesaplanabilir. Ya da C(z,t) için z ve t’ye bağlı olarak bir modelle tanımlanabilir:

C(z,t) = b0 + b1t + b2t2 + b3z+b4z2+b5zt

Bu örnek için uygun modelin

C(z,t) =167 +11.9z-2.74t+0.014t2-0.08zt olduğunu varsayalım.

t = 60 dak. ‘da konsantrasyon profili : C(z,60) = 53.0 +7.1z

)),((1

1

),(

),(000

0

0

z

z

dztzczCAzC

dztzcAAzC

tzR

z AKMt (dakika) 20 40 60 120

2 135 80 75 484 170 110 90 536 180 126 96 60

Tanktaki zamana bağlı olarak farklı derinliklerde ölçülmüş AKM konsantrasyonları aşağıda verilmiştir. Buna göre eğer ilk konsantrasyon değeri C0 =500 mg/l ise, 8 saat sonra tanktan çıkarılan katı madde miktarı nedir?

)),((0z

dztzcAM

C(z,60) = 53.0 +7.1z

8

0

)1.73.5( dzzAM

8

0

)1.753()500(

11)60,8( dzzz

tzR

95.0)8(55.3)853()500(8

11 2 xx

Çıkarılan Katı Miktarı=(500 mg/l)%95 = 475 mg/l

Model Model OluşturmaOluşturma

1. En basit en az parametreli modeli 1. En basit en az parametreli modeli seç. seç.

2. Model parametrelerini belirle (a,b,c)2. Model parametrelerini belirle (a,b,c)

3. Belirleme katsayısını (R3. Belirleme katsayısını (R22), kalanların ), kalanların ortalama karesini (MS) hesapla ve ortalama karesini (MS) hesapla ve kalanların dağılımını çiz. kalanların dağılımını çiz.

ctbzay

1. EN BASİT MODELDEN BAŞLA1. EN BASİT MODELDEN BAŞLA

1. Modeli Seç ve Parametreleri

t = 0 t = t2t = t1

Üç parametreli zamana ve konsantrasyona bağlı bir model oluşturalım:

y = a + bt +cz

Excel’de Araçlar/veri çözümleme / Regresyon (çoklu)

y = 132.3 + 7.125 z-0.968t

Excel’de Çoklu RegresyonExcel’de Çoklu Regresyonz t AKM

2 20 1352 40 902 60 752 120 484 20 1704 40 1104 60 904 120 536 20 1806 40 1266 60 966 120 60

y = 132.3 + 7.125 z-0.968t

ÖZET ÇIKIŞI

Regresyon İstatistikleriÇoklu R 0.918844R Kare 0.844274Ayarlı R Kare 0.809668Standart Hata 18.86323

df SS MS FRegresyon 2 17361.86 8680.929 24.39687 0.000232Fark 9 3202.393 355.8214Toplam 11 20564.25

KatsayılarStandart Hata t Stat P-değeri Düşük %95Yüksek %95Düşük 95.0%Yüksek 95.0%Kesişim 132.3214 16.84666 7.854461 2.56E-05 94.21161 170.4312 94.21161 170.4312X Değişkeni 1 7.125 3.334579 2.136701 0.061349 -0.418348 14.66835 -0.418348 14.66835X Değişkeni 2 -0.967857 0.145533 -6.650432 9.37E-05 -1.297076 -0.638638 -1.297076 -0.638638

Excel’de Araçlar/veri çözümleme / Regresyon (çoklu)

Excel’de Özet Çıkışı

2. Model Değerlendirme2. Model Değerlendirme

R2 = 0.844 (Belirleme katsayısı: modelin veride yakaladığı değişkenlik yüzdesi.

RMS = (y-ỹ)2/v =355.82 : kalanların ortalama karesi : Model tarafından açıklanamayan değişimin önemi, küçük olması istenir.

Kalanların grafiksel kontrolüKalanların grafiksel kontrolü

Kalanlar ve Hesaplanan Madde Kalanlar ve Hesaplanan Madde MiktarıMiktarı

-30

-20

-10

0

10

20

30

40

0 50 100 150 200

AKM

ka

lan

lar

(e)

Kalanlar ve zKalanlar ve z

-30

-20

-10

0

10

20

30

40

0 2 4 6 8

z

ka

lan

lar

(e)

Kalanlar ve tKalanlar ve t

-30

-20

-10

0

10

20

30

40

0 50 100 150

t

ka

lan

lar

(e)

Modelde DeğişiklikModelde Değişiklik

Zamana bağlı grafikten modele bir tZamana bağlı grafikten modele bir t22 teriminin eklenmesi uygun gözüküyor. teriminin eklenmesi uygun gözüküyor.

2dtctbzay Regresyon sonucu:

y = 185.97 + 7.125t + 0.014t2 -3.057z

R2 = 0.97 RMS = 81.5

Kalanların grafiği sayfa 225, Şekil 28.3’de görüldüğü gibi rastsal görünüyor. Bu modelin veriyi tanımlamakta başarılı olduğunu söyleyebiliriz.

C(z,t) = b0 + b1t + b2t2 + b3z+b4z2+b5zt

sdsd SSSS MS = SS/sdMS = SS/sd

RegresyonRegresyon 55 20255.5 (SS)20255.5 (SS) 4051.14051.1

kalanlarkalanlar 66 308.8308.8

(RSS)(RSS)51.551.5

ToplamToplam 1111 20564.220564.2

(SST)(SST)

2. KARMAŞIK MODELDEN BAŞLA2. KARMAŞIK MODELDEN BAŞLA

R2 =SS /SST = 20255/20564 =98.5

Hesaplanan değerlerin ortalamadan farkının kareleri toplamı

SS + RSS

Kalanların Kareleri Toplamı

Model değişimin %98.5’unu açıklayabiliyor. Yüksek R2 değerlerinin olması istenilen bir şeydir. Ancak regresyonun amacı yüksek R2 elde etmekten çok en basit ve uygun modeli belirlemektir. Yüksek R2 değerleri modele daha yüksek dereceli terimler ekleyerek elde edilir.

n

i

yySS1

2)(

n

i

yyRSS1

2)ˆ(

Hangi Model?Hangi Model?

ModelModel bb00 ++

bb11z z ++

bb22tt bb33zz22 bb44tt22 bb55tztz RR22 SSSS FarkFark

AA xx xx xx xx xx xx 98.598.5 2025620256

BB xx xx xx xx xx 98.298.2 2020220202 5454

CC xx xx xx xx xx 98.198.1 1996619966 290290

DD xx xx xx xx 96.896.8 1991219912 344344

EE xx xx xx xx xx 86.486.4 1770517705 25512551

FF xx xx xx xx 85.485.4 1765117651 26052605

GG xx xx xx xx 84.984.9 1741617416 28402840

HH xx xx xx 84.484.4 1736217362 28942894

1. Parametrelerin güvenilirlik aralığına 1. Parametrelerin güvenilirlik aralığına bakılır. Eğer 0, bu aralık içindeyse o bakılır. Eğer 0, bu aralık içindeyse o parametreli terim modelden çıkarılabilir.parametreli terim modelden çıkarılabilir.

Örneğin model A’da zÖrneğin model A’da z22’nin parametresi [-3.81 ’nin parametresi [-3.81 1.56], atılabilir.1.56], atılabilir.

2. İki modelin kareleri toplamının farkını test 2. İki modelin kareleri toplamının farkını test et. et.

ModelModel bb00 ++

bb11z z ++

bb22tt bb33zz22 bb44tt22

bb55tztz RR22 SSSS FarFarkk

AA xx xx xx xx xx xx 98.598.5 2025620256

BB xx xx xx xx xx 98.298.2 2020220202 5454

z2 parametresi düşünce 54 büyüklüğünde bir fark oluşuyor. Bunu z2li terimin varyansı olarak düşünülebilir. Peki 54’lük bir azalma istatistiksel olarak anlamlı bir fark mı?

Anlamlı bir fark olup olmadığını anlamak için Anlamlı bir fark olup olmadığını anlamak için saf deneysel hatadan kaynaklanan hatanın saf deneysel hatadan kaynaklanan hatanın değerine ihtiyaç var. Tekrar ölçümler değerine ihtiyaç var. Tekrar ölçümler olmadığından RMS, 51.5’u deneylerin saf olmadığından RMS, 51.5’u deneylerin saf hata varyansı olarak alabiliriz. hata varyansı olarak alabiliriz.

Model A ve B arasındaki SS farkı: 54Model A ve B arasındaki SS farkı: 54 Model A için hata varyansı : 51.5 Model A için hata varyansı : 51.5

54 > 51.5 ?54 > 51.5 ?

54 > 51,5 ?54 > 51,5 ?

F = 54/51,5 = 1,06F = 54/51,5 = 1,06

FFkk (0.05,k-m,n-k-1)=F(0,05;1;6)= 5,99 (0.05,k-m,n-k-1)=F(0,05;1;6)= 5,99

F<FF<Fk . k . =1,06 < 5,99. =1,06 < 5,99.

zz22’li terimi atmanın regresyon kare ’li terimi atmanın regresyon kare toplamında önemli bir azalmaya neden toplamında önemli bir azalmaya neden olmadığını söyleyebiliriz. olmadığını söyleyebiliriz.

F kriteri yaklaşımıyla diğer modelleri F kriteri yaklaşımıyla diğer modelleri inceleyebiliriz.inceleyebiliriz.

F testi kriteri: Bu test maksimum parametre sayısına (1..k) sahip modeldeki eksiltilmesi düşünülen parametrelerin daha az parametreli (1..m…k) bir model elde etmek üzere anlamlılığını test etme esasına dayanır.

Başka bir deyişle eksiltilmiş parametreli modelin kullanılmasından oluşan kalanların kareleri toplamlarındaki (RSS) farkın (ki bu eksiltilen terimlerden kaynaklanan varyans olarak da düşünülebilir (RSSm –RSSk)/(k-m)) istatistiksel olarak sırf deney hatalarından kaynaklanan varyanstan farklı olup olmadığına bakılır. Tekrar ölçümler yapılmadığından bu hatayı maksimum parametreli modelin kalanların karelerinin toplamından yola çıkarak yaklaşık olarak belirleyebiliriz (RSS/(n-k-1)). Bu durumda:

m: eksiltilmiş parametreli modeldeki parametre sayısı

k: maksimum parametreli modeldeki parametre sayısı

n: Gözlem sayısı

FFmm F istatiksel dağılımına sahip. F istatiksel dağılımına sahip. Bakacağımız hipotez ise:Bakacağımız hipotez ise:

Eğer reddedilmezse, eksiltilmiş Eğer reddedilmezse, eksiltilmiş parametreli model maksimum parametreli parametreli model maksimum parametreli model kadar veriye uygundur ve onun model kadar veriye uygundur ve onun yerine kullanılabilir diyebiliriz. Böylece en yerine kullanılabilir diyebiliriz. Böylece en düşük parametre sayısı olan en uygun düşük parametre sayısı olan en uygun model belirlenmiş olur. model belirlenmiş olur.

F Kriteri ile Model DeğerlendirmeF Kriteri ile Model Değerlendirme

model parametre ss RSS n f(k-m,n-k-1)FA 6 20256 308.8 12 6.607877 0.874352B 5 20202 362.8

model parametre ss RSS n f(k-m,n-k-1)FA 6 20256 308.8 12 5.786148 2.784974D 4 19912 652.8

model parametre ss RSS n f(k-m,n-k-1)FA 6 20256 308.8 12 6.607877 41.30505E 5 17705 2859.8

F Kriteri ile Model DeğerlendirmeF Kriteri ile Model Değerlendirme

model parametre ss RSS n f(k-m,n-k-1)FA 6 20256 308.8 12 6.607877 0.874352B 5 20202 362.8

model parametre ss RSS n f(k-m,n-k-1)FA 6 20256 308.8 12 5.786148 2.784974D 4 19912 652.8

model parametre ss RSS n f(k-m,n-k-1)FA 6 20256 308.8 12 6.607877 41.30505E 5 17705 2859.8

SPSS ile Lineer Olmayan Model SPSS ile Lineer Olmayan Model OluşturmaOluşturma

Yandaki veriye y = Yandaki veriye y = b1*exp(b2*x) b1*exp(b2*x) eşitliğini uydurun. eşitliğini uydurun. 1.“Analyze/Regress1.“Analyze/Regression/Nonlinear” ion/Nonlinear” ‘seçin‘seçin

2. Dependent 2. Dependent parametreniz için parametreniz için y’yi solda çıkan y’yi solda çıkan listeden okla seçinlisteden okla seçin

x y15 0,1030 0,4040 0,9950 2,4360 5,9870 14,7080 36,1690 88,95

SPSS ile Lineer Olmayan Model SPSS ile Lineer Olmayan Model OluşturmaOluşturma

Listenin altındaki Parameters düğmesine Listenin altındaki Parameters düğmesine basıp, modelin parametreleri b1 ve b2’yi basıp, modelin parametreleri b1 ve b2’yi başlangıç değerleriyle birlikte girin.başlangıç değerleriyle birlikte girin.

Model Expression kutusuna model Model Expression kutusuna model denklemini girin. denklemini girin. – B1*exp(b2*x)B1*exp(b2*x)

Sağdaki OK tuşuna basınSağdaki OK tuşuna basın

Iteration Residual SS B B2

1 4,3915E+13 ,100000000 ,200000000 1.1 26593312,82 ,000079334 ,199991331 2 26593312,82 ,000079334 ,199991331 2.1 3509234,234 ,000079390 ,189056131 3 3509234,234 ,000079390 ,189056131 3.1 217434,3629 ,000159843 ,167185734 4 217434,3629 ,000159843 ,167185734 4.1 11425,13724 ,000626792 ,125476012 5 11425,13724 ,000626792 ,125476012 5.1 20121,44669 ,005973521 ,042058594 5.2 13773,97887 ,002482860 ,104551852 5.3 9205,413848 ,001754074 ,117599275 6 9205,413848 ,001754074 ,117599275 6.1 8280,634390 ,003926462 ,109724924

OutputOutput

Iteration Residual SS B B2

Output, DevamOutput, Devam

20 934,7369014 2,97949890 ,037813991 20.1 537,1364318 4,01009844 ,035053003 21 537,1364318 4,01009844 ,035053003 21.1 453,6448913 6,07127044 ,029398240 22 453,6448913 6,07127044 ,029398240 22.1 259,1495492 7,73705857 ,027306463 23 259,1495492 7,73705857 ,027306463 23.1 245,4960955 7,65706718 ,027773991 24 245,4960955 7,65706718 ,027773991 24.1 245,4813975 7,68949079 ,027715779 25 245,4813975 7,68949079 ,027715779 25.1 245,4812578 7,68593653 ,027721816 26 245,4812578 7,68593653 ,027721816 26.1 245,4812564 7,68631159 ,027721191

Output, DevamOutput, DevamRun stopped after 54 model evaluations and 26 derivative evaluations.Iterations have been stopped because the relative reduction between successive residual sums of squares is at most SSCON = 1,000E-08

Nonlinear Regression Summary Statistics Dependent Variable y

Source DF Sum of Squares Mean Square Regression 2 19972,51874 9986,25937 Residual 5 245,48126 49,09625 Uncorrected Total 7 20218,00000

(Corrected Total) 6 5035,71429

R squared = 1 - Residual SS / Corrected SS = ,95125

Asymptotic 95 % Asymptotic Confidence Interval Parameter Estimate Std. Error Lower Upper

B 7,686311592 2,077462596 2,346023978 13,026599205 B2 ,027721191 ,003407453 ,018962055 ,036480328