Pembahasan

11
  Regresi Logistik 1 BAB I PENDAHULUAN 1.1 Latar belakang Metode regresi logistik merupakan sebuah metode yang dapat dipakai untuk memodelkan data dengan respon/variabel dependen dikotomus atau politomus. Seringkali di dalam penelitian, seseorang ingin memodelkan hubungan antara variabel X (prediktor; bebas) dan Y (respon; terikat). Metode yang paling sering dipakai dalam kasus seperti itu adalah regresi linier, baik sederhana maupun berganda. Namun, adakalanya regresi linier dengan metode OLS (Ordinary Least Square) yang sering dipakai tersebut kurang sesuai untuk digunakan. Dikatakan kurang sesuai karena jika regresi linier biasa digunakan akan terjadi pelanggaran asumsi Gauss- Markov. Misalnya pada kasus dimana variabel respon (Y) bertipe data nominal, sedangka n variabel bebas/prediktornya (X) bertipe data interval atau rasio. Contoh kasus (diambil dari rencana skripsi Choirul Maqsudi): Ingin diketahui apakah konsumen akan membeli makanan di rumah makan berdasarkan penilaian konsumen terhadap lokasi, pelayanan, pendapatan, kebersihan, selera dan harga . Dalam kasus ini hanya ada 2 kemungkinan respon konsumen, yaitu konsumen membeli dan tidak membeli. Dari contoh kasus di atas, dapat diketahui bahwa tipe data variabel respon (Y) adalah nominal, yaitu kategorisasi keputusan konsumen apakah membeli atau tidak (misal membeli dilambangkan angka 1, sedangkan tidak membeli dengan angka 0), sedangkan tipe data untuk variabel bebas (X) setidak-tidaknya interval (skala likert). Bila metode regresi linier biasa diterapkan pada kasus semacam ini, menurut Kutner, dkk.(2004), akan terdapat 2 pelanggaran asumsi Gauss-Markov dan 1 buah pelanggaran terhadap batasan dari nilai duga (  fitted value) dari variabel respon (Y), yaitu: 1. Error dari model regresi yang didapat tidak menyebar normal.  2. Ragam (variance) dari error tidak homogen (terjadi heteroskedastisitas pada ragam error). 

Transcript of Pembahasan

Page 1: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 1/11

 

  Regresi Logistik 

1

BAB I

PENDAHULUAN

1.1 Latar belakang

Metode regresi logistik merupakan sebuah metode yang dapat dipakai

untuk memodelkan data dengan respon/variabel dependen dikotomus atau

politomus.

Seringkali di dalam penelitian, seseorang ingin memodelkan hubungan antara

variabel X (prediktor; bebas) dan Y (respon; terikat). Metode yang paling sering

dipakai dalam kasus seperti itu adalah regresi linier, baik sederhana maupun

berganda.

Namun, adakalanya regresi linier dengan metode OLS (Ordinary Least Square)

yang sering dipakai tersebut kurang sesuai untuk digunakan. Dikatakan kurang sesuai

karena jika regresi linier biasa digunakan akan terjadi pelanggaran asumsi Gauss-

Markov. Misalnya pada kasus dimana variabel respon (Y) bertipe data nominal,

sedangkan variabel bebas/prediktornya (X) bertipe data interval atau rasio.

Contoh kasus (diambil dari rencana skripsi Choirul Maqsudi):

Ingin diketahui apakah konsumen akan membeli makanan di rumah makan

berdasarkan penilaian konsumen terhadap lokasi, pelayanan, pendapatan,

kebersihan, selera dan harga. Dalam kasus ini hanya ada 2 kemungkinan respon

konsumen, yaitu konsumen membeli dan tidak membeli.

Dari contoh kasus di atas, dapat diketahui bahwa tipe data variabel respon (Y)

adalah nominal, yaitu kategorisasi keputusan konsumen apakah membeli atau tidak 

(misal membeli dilambangkan angka 1, sedangkan tidak membeli dengan angka 0),

sedangkan tipe data untuk variabel bebas (X) setidak-tidaknya interval (skala likert).

Bila metode regresi linier biasa diterapkan pada kasus semacam ini, menurut Kutner,

dkk.(2004), akan terdapat 2 pelanggaran asumsi Gauss-Markov dan 1 buah

pelanggaran terhadap batasan dari nilai duga ( fitted value) dari variabel respon (Y),

yaitu:

1.  Error dari model regresi yang didapat tidak menyebar normal. 

2.  Ragam (variance) dari error tidak homogen (terjadi heteroskedastisitas

pada ragam error). 

Page 2: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 2/11

 

  Regresi Logistik 

2

3.  Sedangkan, pelanggaran bagi batasan nilai duga Y ( fitted value) adalah

bahwa nilai duga yang dihasilkan dari model regresi linier biasa melebihi

rentang antara 0 s.d. 1. Hal ini jelas tidak masuk akal , karena batasan nilai

pada variabel Y (dalam kasus ini adalah membeli=1 dan tidak membeli=0). Untuk mengatasi masalah ini, diperkenalkan metode Regresi

Logistik. 

1.2  Tujuan

Adapun tujuan dari makalah ini adalah :

a.  Untuk mengetahui apa itu regresi logistik.

b.  Untuk mengetahui bagaimana perhitungan dari regresi logistik.

c. 

Untuk mengetahui penerapan dari regresi logostik.1.3  Rumusan masalah

Adapun rumusan masalah dari makalah ini adalah :

a.  Apa yang dimaksud dengan regresi logistik ?

b.  Bagaimana perhitungan dari regresi logistik ?

c.  Bagaimana penerapan dari regresi logostik ?

1.4  Sistematika penulisan

Adapun sistematika penulisan makalah ini adalah :

Kata pengantar

Daftar isi

Bab I Pendahuluan

1.1 Latar belakang

1.2 Tujuan dan manfaat

1.3 Rumusan masalah

1.4 Sistematika penulisan

Bab II Pembahasan

2.1  Definisi Regresi Logistik.

2.2  Perhitungan Regresi Logistik.

2.3  Penerapan Regresi Logistik.

Bab III Penutup

Page 3: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 3/11

 

  Regresi Logistik 

3

3.1. Kesimpulan

3.2. saran

Daftar Pustaka

Lampiran

Page 4: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 4/11

 

  Regresi Logistik 

4

BAB II

PEMBAHASAN

2.1 Definisi Regresi Logistik.

Regresi logistik (kadang disebut model logistik atau model logit), dalam

statistika digunakan untuk prediksi probabilitas kejadian suatu peristiwa. Metode ini

merupakan model linier umum yang digunakan untuk  regresi binomial. Seperti

analisis regresi pada umumnya, metode ini menggunakan beberapa variabel prediktor,

baik numerik maupun kategori. Misalnya, probabilitas bahwa orang yang menderita

serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia, jenis

kelamin, dan indeks massa tubuh. Regresi logistik juga digunakan secara luas pada

bidang kedokteran dan ilmu sosial, maupun pemasaran seperti prediksi

kecenderungan pelanggan untuk membeli suatu produk atau berhenti berlangganan.

Regresi logistik berguna untuk situasi di mana Anda ingin dapat meramalkan

ada atau tidaknya karakteristik berdasarkan prediksi seperangkat prediktor. Koefisien

regresi logistik dapat digunakan untuk memperkirakan odds ratio untuk setiap

variabel independen dalam model. Odd ratio adalah adalah ukuran dari peningkatan

kemungkinan untuk satu kategori dibandingkan dengan yang lain. Melalui odd ratio

kita akan tahu berapa peningkatan skor variabel dependen yang ditinjau oleh prediktor

tertentu ketika prediktor lainnya adalah konstan.

Regresi logistik digunakan untuk memprediksi variabel yang bersifat kategoris

oleh seperangkat variabel prediksi. Regresi logistik dipilih jika prediktor memuat

campuran variabel kontinu dan kategoris atau prediktor tersebut tidak terdistribusi

yang baik.

Selain itu, regresi logistik telah sangat populer untuk riset medis misalnya

apakah pasien memiliki gejala penyakit tertentu. Pada regresi logistik, variabel

dependen yang diprediksi adalah fungsi dari probabilitas bahwa suatu subjek tertentu

akan berada dalam salah satu kategori.

Page 5: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 5/11

 

  Regresi Logistik 

5

Jadi secara umum, regresi logistik dapat diartikan sebagai teknik statistik yang

digunakan untuk mengetahui pengaruh satu variable independen atau lebih (X)

terhadap satu variable dependen (Y), dengan syarat:

1.  Variabel dependent harus merupakan variable dummy yang hanya

punya dua alternatif. Misalnya Puas atau tidak puas, dimana jika

responden menjawab puas maka kita beri skor 1 dan jika menjawab

tidak puas kita beri skor 0.

2.  Variabel independent mempunyai skala data interval atau rasio.

Regresi logistik dapat dibedakan menjadi 2, yaitu: Binary Logistic Regression

(Regresi Logistik Biner) dan Multinomial Logistic Regression (Regresi Logistik 

Multinomial). Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan

variabel respon (Y), misal membeli dan tidak membeli. Sedangkan Regresi Logistik 

Multinomial digunakan ketika pada variabel respon (Y) terdapat lebih dari 2

kategorisasi.

2.2 Perhitungan Regresi Logistik.

Penyelesaian regresi logistik menggunakan pendekatan persamaan

non linear yaitu model logistik dengan persamaan regresi logistik sebagai berikut:

 

Kurva logistik digambarkan Kurva logistik digambarkan dalam

bentuk S sigmoid dengan nilai  berkisar antara ∞ sampai dengan ∞ dan nilai

bergerak dari 0 sampai 1. Kurva logistik dapat dilihat pada Gambar 1. Nilai

merupakan jumlah dari persamaan linear atau

 

Page 6: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 6/11

 

  Regresi Logistik 

6

Kurva pada Gambar 1 menunjukkan ketika nilai mendekati ∞ maka nilai

bergerak mendekati nilai 0, dan jika nilai mendekati ∞ maka nilai bergerak 

mendekati nilai 1. Fungsi logistik, seperti uraian di atas merupakan fungsi probabilitas

sehingga fungsi regresi logistik lebih tepat untuk dinotasikan sebagai P(D=1| , ,… )

yang berarti bahwa probabilitas D=1 untuk nilai tertentu dari sampai

dengan Penyelesaian persamaan tersebut dengan mengestimasi parameter yang

belum diketahui yaitu . Untuk mengestimasi parameter tersebut maka fungsi

harus diubah menjadi bentuk linear menjadi bentuk odds yaitu probabilitas

sebuah kejadian dibandingkan dengan probabilitas kejadian tersebut tidak terjadi.

Persamaan tersebut menjadi persamaan linear :

Berdasarkan rumus lainnya:

 

 

()  

Page 7: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 7/11

 

  Regresi Logistik 

7

∑ ∑

∑ ∑  

∑ ∑  

2.3 Penerapan Regresi Logistik.

a)  Contoh dalam kehidupan sehari-hari.

Misalkan kita tertarik pada faktor-faktor yang mempengaruhi apakah

seorang kandidat politik akan memenangkan pemilihan atau tidak.

Hasil (respon) variabel dikotomi (0 dan 1); menang atau kalah.

Prediktor yang dipakai adalah: jumlah uang yang dihabiskan untuk 

kampanye, jumlah waktu yang digunakan untuk kampanye negatif dan

apakah atau tidak calon adalah sebuah kewajiban. Karena variabel

respon biner kita harus menggunakan sebuah model yang menangani 0

 / 1 variabel dengan benar.

Peneliti hendak mengidentifikasi pengaruh usia, jenis kelamin dan

aktivitas olahraga kemunculan serangan jantung. Variabel respon

kemunculan serangan jantung berbentuk data dikotomi (0 dan 1) yaitu

muncul dan tidaknya serangan jantung.

Peneliti hendak mengindentifikasi GRE (Graduate Record Exam skor),

IPK (Indeks Prestasi Kumulatif), dan prestise program sarjana untuk 

mendaftarkan diri pada program pascasarjana. Skor pada variabel

dependennya berbentuk dikotomi (0 dan 1) yaitu mendaftar program

pascasarjana atau tidak.

b)  Contoh kasus dengan menggunakan penyelesaian perhitungan.

1.  Seorang peneliti ingin mengetahui bagaimana pengaruh kualitas

pelayanan publik terhadap kepuasan pengguna ( masyarakat ). Kualitas

pelayanan publik diteliti melalui variabel Daya Tanggap (X1) dan

empati (X2). Kepuasan pengguna layanan (Y) sebagai variabel

dependent. Jika responden menjawab puas maka kita beri skor 1 dan

 jika menjawab tidak puas kita beri skor 0.

Page 8: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 8/11

 

  Regresi Logistik 

8

Penyelesaian :

Dengan menggunakan aplikasi SPSS :

Input data di bawah ini!

Karakteristik masing-masing variabel adalah sebagai berikut.

  X1 Daya tanggap

  X2 Empati

  Y kepuasan pengguna

  Value Label : 0 tidak puas

1 puas

 Langkah Regresi Logistik:

a.  Klik Analyze Regression Binary Logistic.

b.  Masukkan variable Y sebagai Dependent dan variable X1 dan X2

sebagai covariates.

c.  Klik OK.

  Output dan Interpretasi Regresi Logistik 

Page 9: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 9/11

 

  Regresi Logistik 

9

Korelasi bersama x1 dan x2 Y (Korelasi majemuk) dengan teknik 

Chi-Square didapat nilai Chi-Square 23.181 dengan Nilai Sig 0.000 < 0.05,

berarti secara bersama-sama Daya Tanggap (X1) dan Empati (X2)

berhubungan dengan Kepuasan pengguna (Y).

Tabel diatas menunjukan koefisien detreminan regresi logistik, yakni

0.497. Sehingga dapat dikatakan kontribusi variabel X1 dan X2 terhadap Y

adalah sebesar 50%.

a. The cut value is .500

Tabel di atas memperlihatkan bawa ketepatan prediksi dalam

penelitian ini adalah sebesar 82%.

a.Variable(s) entered on step 1: X1, X2.

Pengujian secara sendiri-sendiri ternyata hanya X2 yang signifikan

karena nilai Sig 0.018 < 0.05. Sedangkan X2 Sig 0.543 > 0.05 artinya secara

sendirian X1 tidak punya pengaruh yang signifikan terhadap Y.

Page 10: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 10/11

 

  Regresi Logistik 

10

BAB III

PENUTUP

3.1 Kesimpulan

Regresi logistik adalah sebuah pendekatan model matematik 

yang dapat digunakan untuk menggambarkan hubungan beberapa

variabel X dengan variabel dependen yang dikotomus/politomus

(Kleinbaum & Klein, 2002). Model ini digunakan untuk menyelesaikan permasalahan

hubungan antara variabel dependen yang berupa variabel dichotomous maupun

polytomous dengan variabel independen yang dapat berupa variabel ordinal,

nominal maupun rasio.

persamaan regresi logistik sebagai berikut:

 

Regresi logistik berguna untuk situasi di mana Anda ingin dapat meramalkan

ada atau tidaknya karakteristik berdasarkan prediksi seperangkat prediktor. Koefisien

regresi logistik dapat digunakan untuk memperkirakan odds ratio untuk setiap

variabel independen dalam model.

Page 11: Pembahasan

5/12/2018 Pembahasan - slidepdf.com

http://slidepdf.com/reader/full/pembahasan-55a35abfca796 11/11

 

  Regresi Logistik 

11