PENDAHULUAN -...
Transcript of PENDAHULUAN -...
2/7/2011
1
Oleh : Edwin Erifiandi (NRP. 1309 201 701)
Pembimbing : Prof. Dr. Drs. I Nyoman Budiantara, MSi
PENDAHULUAN Latar Belakang (1)g ( )
Salah satu metode statistika untuk memodelkanhubungan antar variabel adalah analisa regresi.
Tiga pendekatan yang digunakan untuk mengestimasikurva regresi: pendekatan parametrik, non parametrik, dan semiparametrik.
Regresi parametrik terdapat asumsi yang sangat kaku Regresi parametrik terdapat asumsi yang sangat kakudan kuat yaitu bentuk kurva regresi diketahui, mislinier, kuadratik, kubik, eksponen dsb.
Dalam regresi parametrik kita dituntut memilikiinformasi masa lalu tentang pola data.
2/7/2011
2
PENDAHULUAN Latar Belakang (2)Latar Belakang (2)
Tidak semua pola hubungan dapat didekati denganparametrik karena keterbatasan informasi masa lalu.
Regresi nonparametrik merupakan pendekatan regresiyang sesuai untuk pola data yang tidak diketahuibentuk kurva regresinya atau tidak ada informasi masalalu yang lengkap (Eubank, 1988 dan Budiantara, 2001)
Model regresi nonparametrik yang banyak digunakanadalah Kernel, Wavelets, MARS, Deret Fourier, Spline, dsb.
PENDAHULUANLatar Belakang (3)g (3)
Pendekatan regresi nonparametrik memilikifleksibilitas yang tinggi karena data mencari sendiribentuk estimasi kurva regresinya tanpa dipengaruhisubyektivitas peneliti.
Dalam beberapa kasus, var respon memiliki hubunganlinier dengan salah satu var prediktor tapi dengan varg p p gprediktor lainnya tidak diketahui pola hubungannya. Dalam keadaan seperti ini, Wahba (1990) menyarankan menggunakan pendekatan regresisemiparametrik.
2/7/2011
3
PENDAHULUANLatar Belakang (4)g (4)
Model‐model regresi semiparametrik adalah Kernel, Spline, Polinomial Lokal, Deret Fourier.
Eubank (1988) menyatakan diantara model‐model regresinonparametrik dan semiparametrik, Spline merupakansalah satu model yang mempunyai interpretasi statistikdan visual sangat baik dan khusus.
S li iliki k b ik i d Spline memiliki kemampuan sangat baik menangani data yang perilakunya berubah‐ubah pada sub‐sub interval tertentu (Cox dan Sullivan, 1996 dan Budiantara, 2006)
Estimator Spline memiliki fleksibilitas yang tinggi(Budiantara, 2004; 2006)
PENDAHULUAN
Latar Belakang (5)Latar Belakang (5)
Sejauh ini estimator Spline dalam regresisemiparametrik yang dikembangkan oleh penelitihanya untuk model regresi satu variabel respon.
Dalam beberapa kasus pada data BPS sering ditemuikasus‐kasus dimana pengukuran variabel dilakukanpada waktu bersamaan sehingga akan melibatkanmodel regresi dengan variabel respon lebih dari satudan saling berkorelasi.
2/7/2011
4
PENDAHULUANRumusanMasalah
1. Bagaimana mendapatkan estimator untuk parameter komponen parametrik dan nonparametrik dalam regresi semiparametrik multirespon?
2. Bagaimana memilih titik knot optimal pada estimatorspline parsial?
3. Bagaimana membuat algoritma dan program untukestimator Spline dalam mengestimasi kurva regresisemiparametrik?semiparametrik?
4. Bagaimana memodelkan data pada studi kasuspengeluaran konsumsi makanan dan bukan makanan di Jawa Timur Tahun 2009?
PENDAHULUANTujuan Penelitian
1. Mendapatkan estimator untuk parameter komponen parametrik dan nonparametrik dalam regresi semiparametrik multirespon.
2. Memilih titik knot optimal pada estimator spline parsial.
3. Membuat algoritma dan program untuk estimator Splinedalam mengestimasi kurva regresi semiparametrikmultirespon.
4 M b t d l h il t di k l k i4. Membuat model hasil studi kasus pengeluaran konsumsimakanan dan bukan makanan di Propinsi Jawa TimurTahun 2009
2/7/2011
5
PENDAHULUAN
Manfaat Penelitian
1. Memahami dan mengerti bagaimana cara
menurunkan estimator untuk kurva regresi komponenmenurunkan estimator untuk kurva regresi komponen
parametrik dan nonparametrik dalam regresi
semiparametrik multirespon.
2. Dapat memilih titik knot optimal pada estimator
spline parsial.
3. Dapat membuat program dan menginterpretasikan
outputnya untuk studi kasus pengeluaran makanan
dan bukan makanan di Jatim Tahun 2009
PENDAHULUAN
Batasan Penelitian1. Untuk memperoleh estimator spline parsial dalam regresi
semiparametrik multirespon yang diperoleh berdasarkan
optimasiWeighted Least Square (WLS).
2. Pola variabel respon dengan variabel prediktor diasumsikan
berpola parametrik linier.
3. Kurva regresi komponen nonparametrik dihampiri dengan
fungsi spline linier.
4. Pemilihan titik knot optimal menggunakan metode GCV.
2/7/2011
6
TINJAUAN PUSTAKA
Analisis Regresi banyak digunakan dalamberbagai bidang dan sangat bergunadalam berbagai penelitian Secara umum dalam berbagai penelitian. Secara umum, Gujarati (1999) menyatakan analisisregresi berkenaan dengan studiketergantungan variabel respon, padasatu atau lebih variabel prediktor, denganmaksud menaksir atau meramalkanvariabel respon.
TINJAUAN PUSTAKAAda 3 pendekatan dalam analisis regresi:1. Regresi Parametrik, diasumsikan bentuk kurva regresi
diketahui. Model umum regresi parametrik:
y X
2. Regresi Nonparametrik, digunakan apabila polahubungan antara variabel respon dengan variabelprediktor tidak diketahui bentuk kurva regresinya. Model umum regresi nonparametrik (Eubank, 1988):
y
( ) , 1,2,...,i i iy f t i n Dalam regresi nonparametrik kurva regresi hanyadiasumsikan mulus (smooth) dalam arti termuat dalamsuatu ruang fungsi tertentu sehingga mempunyai sifatfleksibilitas yang tinggi (Eubank, 1988).
( ) , , , ,i i iy f
2/7/2011
7
TINJAUAN PUSTAKA
3. Regresi semiparametrikmerupakan gabungan antara
i ik d iregresi parametrik dan regresinonparametrik. Model regresisemiparametrik (Eubank, 1988)
( ) 1 2iy x f t i n ( ) , 1,2,...,ii i iy x f t i n
Spline Polynomial Truncated Secara umum didefinisikan sbb:
( ) ( )q m
qkk l lf t t t K
: merupakan parameter polinomial
1 1( ) ( )k l l
k lf
;
0 ;
qq l
lt K t K
t Kt K
p p p
: parameter truncated
K1, K2,…,Km adalah titik knot yaitu titik perpaduanbersama dimana terdapat perubahan perilaku fungsipada interval yang berlainan (Budiantara, 2006)
2/7/2011
8
Jika k=1 dan banyak knot=1 maka didapat fungsi splinelinier dengan satu knot dapat disajikan dalam bentuk:
1( ) ( )t t K
f t t t K
Dapat disajikan dalam gambar:
1( ) ( )
( )f t t t K
t t K t K
1( )t t K t( )f t
tK
t K t K
TINJAUAN PUSTAKA
Pemilihan Titik Knot Optimal
Salah satu metode pemilihan titik knot optimal adalah Generalized Cross optimal adalah Generalized Cross Validation (GCV) (Budiantara,2000). Titik knot optimal didapat dari nilai GCV
terkecil. Fungsi GCV didefinisikan: 1 2
1 2, , , M
MMSE K K K
GCV K K K
1 2 1 2
1 2
, , ,( [ , , , ])
MM
GCV K K Kn tr I A K K K
1 2
211 2 , , ,
1
ˆ, , ,M
M
M j jK K Kj
MSE K K K n y f t
11 2 1 1 1 1( , , , ) ( , , )( ( , , ) ( , , )) ( , , )M M M M MA K K K T K K T K K T K K T K K
2/7/2011
9
TINJAUAN PUSTAKA
Tinjauan Non Statistik: PengeluaranKonsumsi Makanan dan BukanMakanan.
Indikator kesejahteraan terkait konsumsiadalah tingkat kemiskinan, yaitukemampuan masyarakat dalammemenuhi kebutuhan dasar sehari‐hari.
Didalammemenuhi kebutuhannya, individuatau rumahtangga memiliki perilakukonsumsi yang menggambarkan polakonsumsi rumahtangga tersebut.
TINJAUAN PUSTAKA
Beberapa faktor yang mempengaruhi polakonsumsi:
1 Tipologi wilayah(desa/kota)1. Tipologi wilayah(desa/kota)
2. Karakteristik sosial (tingkat pendidikan, jumlah ART)
3. Karakteristik ekonomi(pendapatan)
2/7/2011
10
METODOLOGI
Bahan dan Alat
1. Data Susenas tahun 2009 Propinsi JawaTimurTimur.
2. Software Matlab R2009a, SPSS 11.5 for Windows dan Minitab 15.
METODOLOGI
Variabel Penelitian
Variabel Respon:
Y1 = Pengeluaran konsumsi makanan/kapita/bln(Rp)Y1 Pengeluaran konsumsi makanan/kapita/bln(Rp)
Y2 = Pengeluaran konsumsi bkn mknan/kapita/bln(Rp)
Variabel Prediktor:
X1 = pendapatan/kapita/bln (Rp)
X2 = persentase KRT yang berpendidikan minimal SMA
X1 = jumlah ART (orang)
T1 = umur kepala rumahtangga (tahun)
2/7/2011
11
Definisi Operasional:
1. Pengeluaran /kapita/bulan adalah biaya yang dikeluarkan untuk konsumsi semua ART selamasebulan dibagi dengan banyaknya ART.
2. Pendapatan per kapita dalam penelitian inimenggunakan pendekatan pengeluaran per kapita.
3. Persentase KRT yang berijasah minimal SMA adalahbanyaknya KRT yang telah menamatkan pendidikandan memiliki ijasah SMA atau Perguruan Tinggi.
4 Banyaknya ART adalah semua orang yang biasanya4. Banyaknya ART adalah semua orang yang biasanyabertempat tinggal di suatu rumahtangga.
5. Umur KRT dihitung dalam tahun pembulatan kebawah atau umur pada waktu ulang tahun terakhir.
METODOLOGILangkah‐langkah Penelitian
1. Estimasi kurva regresi komponen parametrikdan nonparametrik
a. Menyajikan model regresi semiparametrik multirespon:
( ) 1 2 1 2f t k i
b. Kurva regresi dihampiri dengan fungsi spline parsial truncated .
c. Membuat model regresi semiparametrik multirespon dalam b t k t ik
( ) , 1,2, , , 1,2, ,ki ki p k i kiy x f t k r i n
1 1( ) ( )
s mh h
i kh ki kd ki kdh d
S t t t K
bentuk matrik.
d. Menentukan matrik bobot variance‐covariance e. Mencari estimasi parameter dgn menyelesaikan optimasi WLSe. Menyelesaikan optimasi WLS (Weighted Least Square)
( , )y Z x t
2/7/2011
12
METODOLOGI
2. Untuk memperoleh titik knot optimal pada estimator spline diperlukan langkah sebagai berikut:langkah sebagai berikut:
a. Mendefinisikan nilai
b. Mendapatkan matrik1[ , , ]rMSE K K
1[ ]A K Kc. Mencari titik knot optimal yang
meminimumkan fungsi GCV
1[ , , ]rA K K
METODOLOGI3. Membuat algoritma dan program komputer untuk
menyelesaikan tujuan:
a. Mendapatkan estimator spline dalam regresi semiparametrik multiresponsemiparametrik multirespon
Merancang model regresi semiparametrikmultirespon
Mendapatkan matrik pembobot variance covariance
M ilk ti t li b d k Menampilkan estimator spline berdasarkanpenghitungan.
2/7/2011
13
METODOLOGI
b. Algoritma memilih titik knot optimal pada estimator spline:
Tentukan jumlah titik knot Tentukan jumlah titik knot
Lakukan penghitungan semua GCV untukmendapatkan titik knot optimal.
Tentukan nilai GCV terkecil dan titik knot optimal.optimal.
METODOLOGI
4. Memodelkan data pengeluaran konsumsi makanandan bukan makanan dari output program sbb:
a. Membuat plot data antara var respon dan prediktor
b. Memodelkan var prediktor komponennonparametrik dengan var respon menggunakanspline truncated
c. Menerjemahkan nilai GCV dan titik knot
d. Mengambil kesimpulan titik knot optimal.g p p
e. Mengambil kesimpulan model estimasi splineuntuk mengestimasi kurva regresisemiparametrikmultirespon
2/7/2011
14
HASIL DAN PEMBAHASAN
1. ESTIMASI MODEL SPLINE LINIER DALAM REGRESI SEMIPARAMETRIK
Hubungan antara mengikuti model regresi, ,ki ki kix t yg g g
semiparametrik:
Fungsi f didekati dgn fungsi spline linier dg m titik knot sehingga model regresi semiparametrik dpt ditulis:
( ) , 1,2, , , 1,2,ki ki k k i ki ky x f t k r i n
0 1 1 1s
ki k k i kp pi k ki ks kiy X X t t
1 1( ) ( )
p p
s sk ki k km ki km kit K t K
Model semiparametrik dapat ditulis dalam bentukmatrik sbb:
1 1 1 10y Z
Kemudian matrik variance covariance berukuran
1 ( )( ) 1 1
0r r r ry Z
y Z
Nx Nx rp rs rm rp rs rm x Nx
1 1
r r
k kk k
n x n
21 1 12 1
22 1 21 2 2 2
21 2
( ) ( ) ( )
( ) ( ) ( )[ ( )]
( ) ( ) ( )
r
r
r r r r
W W W
W W WW
W W W
2/7/2011
15
Estimasi parameter model diperoleh dengan metodeWeighted Least Square
S l h di k h d b d h il
( ) ( )1 1( ) [ , , ] [ , , ]
rp rs rm rp rs rmr rMin W Min y Z K K W y Z K K
Setelah diturunkan terhadap beta dan hasilnyadisamakan dengan nol, didapatkan hasil
E i i k k i
1 1 1
11 1 1
ˆ, , , , , ,
ˆ , , , , , ,
r r r
r r r
Z K K WZ K K Z K K Wy
Z K K WZ K K Z K K Wy
Estimasi untuk kurva regresi
1
11 1 1 1
1
ˆ ˆ( , ) , ,
, , , , , , , ,
, ,
r
r r r r
r
f X t Z K K
Z K K Z K K WZ K K Z K K Wy
A K K y
Titik Knot Optimal diperoleh
1 ˆ ˆ( , ) ( , )N y f X t y f X t
1 1
1
1 2, , , , 11
11 1
2, , 11
( , ) ( , )[ , , ]
[ , , ]
[ , , ] [ , , ]
[ , , ]
r r
r
rK R K R K R K R
r
r r
K R K Rr
N y f X t y f X tMin GCV K K Min
N trace I A K K
N y I A K K I A K K yMin
N trace I A K K
2/7/2011
16
Deskripsi Pengeluaran Konsumsi Makanan(Y1) danBukanMakanan(Y2) dengan variabel Prediktor
Scatter plot pendapatan per kapita terhadappengeluaran makananpengeluaran makanan
325000
300000
275000
250000
225000an M
akan
an (
Rp)
700000600000500000400000300000
225000
200000
175000
150000
Pendapatan per Kapita (Rp)
Peng
elua
ra
Scatter plot pendapatan per kapita terhadappengeluaran bukan makanan
400000
350000
300000
250000
200000aran
Buk
an M
akan
an (
Rp)
700000600000500000400000300000
150000
100000
Pendapatan per Kapita (Rp)
Peng
elu
2/7/2011
17
Scatter plot Persentase KRT berpendidikan minimal SMA terhadap Pengeluaran Konsumsi Makanan
325000325000
300000
275000
250000
225000
200000ngel
uara
n M
akan
an (
Rp)
6050403020100
175000
150000
Persentase KRT Berpendidikan minimal SMA (%)
Pen
Scatter plot Persentase KRT berpendidikan minimal SMA terhadap Pengeluaran Konsumsi Bukan Makanan
400000400000
350000
300000
250000
200000
uara
n Bu
kan
Mak
anan
(R
p)
6050403020100
150000
100000
Persentase KRT Berpendidikan minimal SMA (%)
Peng
elu
2/7/2011
18
Scatter plot Persentase KRT berpendidikan minimal SMA terhadap Pengeluaran Konsumsi Bukan Makanan
400000400000
350000
300000
250000
200000
uara
n Bu
kan
Mak
anan
(R
p)
6050403020100
150000
100000
Persentase KRT Berpendidikan minimal SMA (%)
Peng
elu
Scatter plot Jumlah Anggota Rumahtangga terhadapPengeluaran Konsumsi Makanan
325000
300000
275000
250000
225000
200000gelu
aran
Mak
anan
(R
p)
432
200000
175000
150000
Jumlah Anggota Rumahtangga
Peng
2/7/2011
19
Scatter plot Jumlah Anggota Rumahtangga terhadapPengeluaran Konsumsi Bukan Makanan
400000
350000
300000
250000
200000
uara
n B
ukan
Mak
anan
(R
p)
432
150000
100000
Jumlah Anggota Rumahtangga
Peng
elu
Scatter plot Umur Kepala Rumahtangga terhadapPengeluaran Konsumsi Makanan
325000325000
300000
275000
250000
225000
elua
ran
Mak
anan
(R
p)
605550454035
200000
175000
150000
Umur Kepala Rumahtangga (tahun)
Peng
e
2/7/2011
20
Scatter plot Umur Kepala Rumahtangga terhadapPengeluaran Konsumsi Bukan Makanan
400000
350000
300000
250000
200000ran
Buka
n M
akan
an (
Rp)
605550454035
200000
150000
100000
Umur Kepala Rumahtangga (tahun)
Peng
elua
Spline Univariabel Variabel Prediktor KomponenNonparametrik dan Variabel Multirespon
Spline Linier 1,2, dan 3 Knot
No Knot Respon 1 Knot Respon 2 Nilai GCV
1. 41 43 4294290404.89
2. 35 36 4517377813.26
3. 36 38 4484276889.60
4. 43 41 4342611140.04
5. 48 42 4587311365.99
2/7/2011
21
Spline Linier 2 Knot
No Knot Respon 1 Knot Respon 2 Nilai GCVp p
1. K1=35, K2=36 K1=35, K2=36 4791068131.76
2. K1=34, K2=35 K1=34, K2=39 4790471147.48
3. K1=40, K2=57 K1=45, K2=46 4411903568.08
4 K 35 K 46 K 38 K 41 4912006737 334. K1=35, K2=46 K1=38, K2=41 4912006737.33
5. K1=40, K2=42 K1=36, K2=41 4800568323.77
Spline Linier 3 Knot
No Knot Respon 1 Knot Respon 2 Nilai GCV
1. K1=39, K2=42, K3=47 K1=38, K2=51, K3=54 5075676285.00
2. K1=40, K2=42, K3=45 K1=36, K2=41, K3=46 5088090326.22
3. K1=36, K2=38, K3=40 K1=34, K2=36, K3=37 5098309695.42
4 K 40 K 41 K 42 K 37 K 40 K 43 4975442262 714. K1=40, K2=41, K3=42 K1=37, K2=40, K3=43 4975442262.71
5. K1=41, K2=56, K3=57 K1=45, K2=46, K3=56 4511383946.58
2/7/2011
22
Estimasi model spline linier multirespon dengan knot pada t1=41 dan t2=43
Parameter EstimasiParameter Estimasi1
1
2
2
1̂ 5483.52
1̂ 6998.03
2̂ 4631.57
2̂ 5762.85
Kurva spline linier untuk respon 1
3
3.2
3.4x 10
5 Plot estimasi spline linear satu titik knot
2
2.2
2.4
2.6
2.8
Pen
gel
uar
an M
akan
an
30 35 40 45 50 55 601.4
1.6
1.8
Umur Kepala Rumah Tangga
2/7/2011
23
Kurva spline linier untuk respon 2
4
4.5x 10
5 Plot estimasi spline linear satu titik knot
2
2.5
3
3.5
Pen
gel
uar
an B
uka
n M
akan
an
30 35 40 45 50 55 601
1.5
Umur Kepala Rumah Tangga
P
PemilihanModel SplineMultirespon Terbaik
No Model Spline Multirespon Nilai GCV Keterangan
1. Model knot optimal 1 knot 3267327848.39 Spline linier 1 titik knot
2. Model knot optimal 2 knot 2435602885.97 Spline linier 2 titik knot
3 M d l k i l 3 k 2635548070 05 S li li i 3 i ik k3. Model knot optimal 3 knot 2635548070.05 Spline linier 3 titik knot
2/7/2011
24
Estimasi Model SplineMultirespon Terbaik
1 1
1927551.25 0.00221 +7.23 103.44makan pdptn didik art
1 150537.05 50557.48 34 53.98 48umur umur umur
1 1
_ 46471.78 0.38440 430.39 4834.48
346.29 7807.01 54 +14396.19 56
bkn mkn pdptn didik art
umur umur umur
KESIMPULANBerdasarkan hasil dari penelitian yang telah dilakukan dapatdiambil kesimpulan sebagai berikut:
1. Estimator komponen parametrik dan nonparametrik
1
dengan
dimana
11 1 1, , , , , ,r r rZ K K WZ K K Z K K Wy
1 2
ˆ ˆ ˆ ˆ( , , , )r
ˆ ˆ ˆ ˆ ˆ ˆ ˆ( ) 1k r 1 1 1( ), 1, , .k k kp k ks k km k r
2/7/2011
25
Estimator kurva regresisemiparametrik
ˆ ˆ( )f X t Z K K
1
1
1 1 1 1
1
( , ) , ,
, , , , , , , ,
, ,
r
r r r r
r
f X t Z K K
Z K K Z K K WZ K K Z K K Wy
A K K y
GCV minimum diperoleh dari fungsi
1 1
11 1
1 2, , , , 11
, , , ,, ,
, ,r r
r r
rK R K R K R K R
r
N y I A K K I A K K yMin GCV K K Min
N trace I A K K
2/7/2011
26
Berdasarkan nilai GCV minimum didapatkanmodel spline dalam regresi semiparametrikmultirespon sebagai berikut:
a. Model pengeluaran konsumsi makanan yang terbentuk dengan menggunakan model terbaikadalah sebagai berikut:
1927551.25 0.00221 +7.23 103.44makan pdptn didik art
1 150537.05 50557.48 34 53.98 48umur umur umur
b. Model pengeluaran konsumsi bukan makananyang terbentuk dengan menggunakan model terbaik adalah sebagai berikut:
4647178 0 38440 430 39 483448bk k d t didik t
1 1
_ 46471.78 0.38440 430.39 4834.48
346.29 7807.01 54 +14396.19 56
bkn mkn pdptn didik art
umur umur umur
2/7/2011
27
TERIMA KASIHTERIMA KASIH