PENYELESAIAN KASUS MULTIKOLINEARITAS
-
Upload
marfianti-rell -
Category
Documents
-
view
658 -
download
90
description
Transcript of PENYELESAIAN KASUS MULTIKOLINEARITAS
-
PENYELESAIAN KASUS MULTIKOLINEARITAS
PADA DATA PENJUALAN PERALATAN ELEKTRONIK DENGAN
METODE BEST SUBSET REGRESSION
MAKALAH
Disusun untuk memenuhi tugas mata kuliah Analisis Regresi
yang dibina oleh Ir. Hendro Permadi, M.Si
Oleh
Anita Hermaningtyas 408312408019
Rina Uktafiya 408312409119
Umi Qoiriah 408312409125
Dwi Rahmawati Utami 40831240913
UNIVERSITAS NEGERI MALANG
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PROGRAM STUDI MATEMATIKA
Desember 2010
-
BAB 1
PENDAHULUAN
A. Latar Belakang
Regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan suatu variabel terhadap variabel yang lain. Variabel yang pertama
disebut dengan variabel bebas atau variabel karena seringkali digambarkan
dalam grafik sebagai absis. Variabel yang kedua adalah variabel terikat atau
variabel , dalam grafik digambarkan sebagai ordinat. Kedua variabel ini
biasanya merupakan variabel acak (random).
Apabila kita menggunakan model regresi
, dalam hal ini kita mempunyai asumsi bahwa , , , , sebagai
variable-variabel bebas tidak berkorelasi satu sama lain. Seandainya variable-
variabel bebas tersebut berkorelasi satu sama lain, maka dikatakan terjadi
kolinearitas berganda (multicollinearity). Ada kemungkinan terjadi 2 variabel atau
lebih mempunyai hubungan yang sangat kuat sehingga pengaruh masing-masing
variable tersebut terhadap sukar untuk dibedakan (Supranto, 2001).
Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi
yang tinggi antara masing-masing variabel independen dalam model regresi.
Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang digunakan
saling terkait dalam suatu model regresi. Oleh karena itu masalah
multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya
melibatkan satu variabel independen.
Best subset adalah suatu metode pemilihan variable X yang memuat
hubungan terbaik dengan variable Y. Menaksir persamaan regresi semua
kemungkinan menggunakan semua kemungkinan kombinasi dari variabel
independen. Pilih terbaik sesuai dengan mencari disesuaikan tertinggi di R2 dan
standart error terendah.
-
B. Rumusan Masalah
1. Bagaimana mengidentifikasi multikolinearitas?
2. Bagaimana cara mengatasi multikolinearitas?
3. Bagaimana aplikasi dari metode best subset?
C. Tujuan
1. Untuk mengetahui mengidentifikasi multikolinearitas.
2. Untuk mengetahui cara mengatasi multikolinearitas.
3. Untuk mengetahui aplikasi dari metode best subset.
-
BAB II
PEMBAHASAN
Dalam suatu penelitian ilmiah biasanya yang diteliti adalah hubungan
antara peubah, dimana perubah itu sebut saja hubungan antara peubah, dimana
peubah itu sebut saja peubah bebas dan peubah tak bebas . Hubungan tersebut
dapat pula berupa hubungan fungsional antar peubah yang satu dengan peubah
yang lain. Tetapi masing-masing peubah merupakan bilangan random, sehingga
bilamana peubah dipengaruhi atau ditentukan besarnya oleh peubah maka
dapat dikatakan bahwa permasalahan tersebut dapat diselesaikan dengan
menggunakan teknik analisis regresi (Nugroho, 1990b).
Dalam penelitian ini analisis yang dipergunakan adalah Analisis Regresi
Berganda. Menurut Nugroho (1990b) ada beberapa alas an dipergunakan Regresi
Berganda :
a. Membuat persamaan di dalam yang memberikan prediksi yang terbaik
terhadap . Dengan adanya banyak peubah , mungkin juga termasuk di
dalamnya pemilihan subset yang terbaik untuk memprediksi .
b. Dengan mengetahuinya peubah-peubah yang berpengaruh terhadap ,
mungkin perlu membuat rangking yang didasarkan pada besarnya
pengaruh terhadap .
Analisis Regresi Linier Berganda merupakan bentuk umum sedangkan
Regresi Linier Sederhana merupakan bentuk khusus dari Regresi Linier Berganda
yaitu apabila satu peubah bebas yang dilibatkannya (Yitnosumartono, 1988)
Dalam regresi linier berganda terdapat satu peubah tak bebas yang akan
dilihat hubungannya dengan dua atau lebih peubah bebasnya, umpakan bahwa
pengamatan-pengamatan dapat dinyatakan dengan fungsi-fungsi linier dari
beberapa , , , ..., yang diketahui dan faktor sisa. Model populasinya
adalah sebagai berikut:
................................... 5.8
-
I = 1, 2, 3, ...,
Dimana = Nilai pengamatan yang ke-
, ..., = peubah bebas yang menentukan nilai pengamatan ke-
, ..., = koefisien-koefisien regresi sebagian (parsial) untuk
peubah , ..., , secara berturut-turut.
= titik potong sumbu
= faktor sisaan yang ke-
= banyaknya pengamatan
Berdasarkan dari matriks korelasi kita dapat mengetahui gambaran
kolinearitas ganda antara peubah bebas secara kasar dengan jalan menggunakan
metode membanding koefisien korelasi dalam matriks korelasi dengan nilai kritis
pada taraf nyata . Dari koefisien yang terpilih lalu dihitung korelasi parsialnya
setelah itu langsung dilakukan pengujian hipotesis dimana :
Adapun statistik uji yang digunakan adalah :
dimana :
= banyaknya pengamatan
= banyaknya peubah bebas
Bila mana benar maka mengikuti distribusi dengan derajat bebas
pada taraf nyata , jika ( ) maka ditolak yang berarti
kolinearitas ganda disebabkan karena dan terjadi secara bersama-sama
dalam regresi.
Multikolinieritas (kolinearitas ganda) ditemukan oleh Ragner Frisch yang
berarti adanya hubungan linier yang sempurna atau pasti diantara beberapa atau
semua variabel yang menjelaskan ( , , ..., ) dari model regresi.
Beberapa cara mengetahui apakah suatu model regresi itu mempunyai
kolinearitas ganda atau tidak adalah sebagai berikut:
-
a. Suatu model yang variable-variabel penjelasnya bersifat kolinearitas
memperlhatkan tanda-tanda sebagai berikut:
1. Koefisien determinasi ganda tinggi
2. Koefisien korelasi sederhananya tinggi
3. VIF (Variance Inflation Factor )
Jika nilai VIF lebih besar atau sama dengan 10, menandakan adanya
multikolinieritas pada variabel bebas.
4. Tak satupun (sedikit sekali diantaranya) variable-variabel bebas
memiliki uji- yang signifikan, walaupun keadaan 1, 2 dan 3 terpenuhi.
b. Jika hanya ada dua variable bebas yang ternyata korelasi antara kedua
variable itu tinggi, maka dapat merupakan indikasi bahwa dalam model
tersebut terjadi kolinearitas. Akan tetapi apabila model itu mempunyai
lebih dari dua variable bebas, walaupun korelasi antara dua variable
rendah, tidak dapat menjadi jaminan bahwa model tersebut tida bersifat
multikollinearitas.
c. Apabila model yang akan diuji adalah: ( ) dengan
koefisien determinasi gandanya adalah tinggi yakni:
mendekati 1,
akan tetapi ,
, mempunyai nilai yang sangat rendah
dibandingkan nilai kofisien determinasi ganda antara dengan , , dan
berarti ada kolinearitas ganda.
d. Mengadakan uji antara variable-variabel bebasnya. Jika hitung
dibandingkan dengan tabel dan ternyata signifikan maka dapat dianggap
bahwa ada multikolinearitas (Awat, 1995).
Akibat Adanya Kolinearitas Ganda
Jika hubungan antar variable bebasnya sempurna, maka koefisien
regresi parsial tak akan dapat diestimasi.
Kalau hubungan tersebut tidak sempurna, maka koefisien regresi
parsial masih bisa diestimasi, tetapi kesalahan baku dari penduga
koefisien regresi parsial sangat besar. Hal ini menyebabkan
pendugaan/peramalan nilai kurang teliti.
-
Cara Mengatasi Masalah Kolinearitas Ganda
Memeriksa secara teoritis untuk mengetahui apakah antara variable
bebas memang ada hubungannya.
Mengadakan penggabungan antara data cross-section dan time series,
yang akan disebut sebagai polling data.
Mengeluarkan salah satu variable bebasnya dari model tersebut.
Mentransformasi variable yang ada dalam model.
Menambah data baru, yakni menambah jumlah observasi atau .
Dengan semakin besarnya , maka ada kemungkinan bahwa standard
error akan semakin kecil pula.
Best Subset Regression
Regresi terbaik(best subsets regression) digunakan untuk meregresikan
satu peubah respon pada semua kemungkinan kombinasi subset peubah-peubah
prediktor dan kemudian memilih subset terbaik untuk setiap ukuran (size)
informasi model terbaik ini dipilih berdasarkan nilai R-square terbesar. Pada
setiap regresi subset terbaik ditampilkan statistik, yaitu : R-sq, adj R-sq, S dan C-
p. Jika model di fit tanpa konstanta, R-sq dan adj R-sq tidak ditampilkan.
-
APLIKASI
P.T. Cemerlang dalam beberapa bulan gencar mempromosikan sejumlah peralatan
elektronik dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data
mengenai kenaikan penjualan, biaya promosi, jumlah outlet, laju penduduk,
jumlah pesaing dan income masyarakat pada bulan Mei 2010.
Kenaikan
Penjualan
(%)
Income
Masyarakat
(%)
Banyaknya
Sales
Biaya
Promosi
Outlet Pesaing Laju
Penduduk
(%)
10
12
30
25
8
38
21
14
9
17
24
48
55
35
60
5,46
2,43
2,56
3,55
4,35
3,65
3,44
2,55
4,79
2,53
2,75
2,53
3,51
2,81
3,01
205
206
254
246
201
291
234
209
204
216
245
286
312
265
322
26
28
35
31
21
49
30
30
24
31
32
47
54
40
42
159
164
198
184
150
208
184
154
149
175
192
201
248
166
287
15,00
16,00
19,00
17,00
11,00
24,00
16,00
10,00
1,35
2,13
2,64
1,63
2,53
2,54
1,53
2,00
1,50
1,75
1,64
2,65
1,45
1,67
2,74
14,00
14,00
11,00
19,00
21,00
18,00
18,00
-
Keterangan :
= Kenaikan penjualan
= Income masyarakat
= Banyaknya sales
= Biaya Promosi
= Outlet
= Pesaing
= Laju penduduk
Dari hasil minitab yang didapat untuk mencari best subset dicari C-P
dengan nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.
-
Sedangkan,
Dari data di atas dapat dilihat bahwa pada regresi dan korelasinya ada
perubahan tanda sehingga menunjukkan bahwa data tersebut multikolinearitas.
Lalu kita mulai menggunakan metode best subset yaitu dicari C-P dengan
nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.
-
Dari keterangan di atas dapat dilihat R-sq yang besar dengan C-p dan S
terkecil adalah persamaan dengan variable , , , , , .
Menganalisis dengan melihat nilai C-p bukan terkecil, Sterkecil, dan R-Sq
(Adj)
-
Dapat dilihat bahwa pada persamaan regresi tersebut masih terdapat
perubahan tanda sehingga masih terdapat kasus multikolinieritas sehingga
persamaan regresi tersebut juga masih mengandung kasus multikolinieritas.
Oleh karena itu, kita cari persamaan regresi yang lebih baik dengan C-p
terkecil selanjutnya dan beda R-sq yang tidak jauh dari R-sq yang terbesar sehigga
diperoleh persamaan regresi terbaik.
Selanjutnya dipilih variable , , dan karena memiliki C-p dan s terkecil
dan R-Sq (Adj ) terbesar.
Berdasarkan hasil regresi di atas dapat dilihat bahwa masih terjadi perubahan
tanda pada persaman regresinya..Sehingga masih terjadi kasus
multikolineariatas.Oleh karena itu perlu dipilih kemungkinan variable yang lain
dengan 2 variabel yang merupakan variable terbaik.
Berikut ini analisis regresi dari dengan variabel bebas dan dengan C-
p terkecil namun bukan terkecil dan R-Sq(Adj) bukan terbesar.
Lalu diregresikan :
-
Dari analisis di atas, nampak bahwa pada persamaan regresi sudah tidak terjadi
perubahan tanda lagi. Serta VIF dari kedua variabel tersebut keduanya kurang dari
5. Sehingga dapat disimpulkan bahwa variabel yang paling berpengaruh terhadap
yaitu dan sehingga model regresi yang terbaik yaitu
dengan R-sq = dan R-sq(adj) = yang
selisihnya tidak jauh dari R-sq yang terbesar.
-
BAB III
KESIMPULAN
Berdasarkan pembahasan data di atas dapat disimpulkan bahwa:
1. Dari data penelitian kenaikan penjualan peralatan elektronik pada PT
Cemerlang, ternyata terjadi kasus multikolinieritas. Maka untuk mengatasinya
digunakan metode best subset regression.
2. Dari hasil analis menggunakan metode best subset regression diperoleh 2
variable yang paling mempengaruhi kenaikan penjualan peralatan elektronik,
yaitu banyaknya sales dan benyaknya pesaing.
3. Dengan menggunakan metode best subset regression diperoleh model regresi
terbaik yaitu dengan nilai C-P = 1,6 merupakan nilai paling kecil, nilai
bukan terkecil, nilai R-Sq (Adj) = , dengan persamaan
regresi
4. Dari kesimpulan 1, 2, 3 dapat disimpulkan bahwa semakin banyak sales dan
sedikit pesainga, semakin tinggi kenaikan penjualan peralatan elektronik.
DAFTAR PUSTAKA
Permadi, Hendro. 1999. Teknik Analisis Regresi. UM Press: Jakarta.
http://myunanto.staff.gunadarma.ac.id/Downloads/files/19417/BAB+15+REGRE
SI+TIP+TRIK+BERBAGAI+METODE+REGRESI+BERGANDA.pdf