ANALISIS KLASTER K-MEANS DAN K-MEDIAN PADA DATA … · 2013-05-27 · ANALISIS KLASTER K-MEANS DAN...

ANALISIS KLASTER K-MEANS DAN K-MEDIAN PADA

DATA INDIKATOR KEMISKINAN (Studi Kasus Data Indikator Kemiskinan Kabupaten di Indonesia Tahun 2009)

Febriyana

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI

SYARIF HIDAYATULLAH

JAKARTA

2011 M / 1432 H

ANALISIS KLASTER K-MEANS DAN K-MEDIAN PADA

DATA INDIKATOR KEMISKINAN (Studi Kasus Data Indikator Kemiskinan Kabupaten di Indonesia Tahun 2009)

Skripsi Sebagai Satu Syarat Untuk Memperoleh

Gelar Sarjana Sains

Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Oleh

Febriyana

107094002893

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI

SYARIF HIDAYATULLAH

JAKARTA

2011 M / 1432 H

ii

PENGESAHAN PEMBIMBING

ANALISIS KLASTER K-MEANS DAN K-MEDIAN PADA DATA

INDIKATOR KEMISKINAN

(Studi Kasus Data Indikator Kemiskinan Kabupaten di Indonesia Tahun 2009)

Skripsi Sebagai satu syarat untuk memperoleh

Gelar sarjana sains Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Oleh

Febriyana

107094002893

Menyetujui,

Dosen Pembimbing I Dosen Pembimbing II

Suma’inna, M.Si Bambang Ruswandi, M. Stat NIP. 150 408 699 NIDN. 0305108301

Mengetahui : Ketua Program Studi Matematika

Yanne Irene, M. Si NIP. 19741231 200501 2018

iii

PENGESAHAN UJIAN

Skripsi berjudul “Analisis Klaster K-Means dan K-Median Pada Data Indikator Kemiskinan” yang ditulis oleh Febriyana, NIM 107094002893 telah di uji dan dinyatakankan lulus dalam sidang Munaqosyah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 8 Juni 2011 Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) Program Matematika.

Menyetujui,

Penguji 1, Penguji 2,

Taufik Edy Sutanto, M. ScTech Dr. Agus Salim, M.Si NIP. 19790530 200604 1002 NIP. 19720816 199903 1 003

Pembimbing 1, Pembimbing 2,

Suma’inna, M.Si Bambang Ruswandi, M. Stat NIP. 150408699 NIDN. 0305108301

Mengetahui :

Dekan Fakultas Sains dan Teknologi, Ketua Program Studi Matematika,

DR. Syopiansyah Jaya Putra, M. Sis Yanne Irene, M. Si NIP. 19680117 200112 1001 NIP. 19741231 200501 2018

iv

PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-

BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN

SEBAGAI SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA

MANAPUN.

Jakarta, Juni 2011

Febriyana 107094002893

Karya ini ku persembahkan untuk

Orangtuaku tercinta yang telah banyak mencurahkan

kasih sayang dan dukungan baik moril maupun materi

Fitriana Fadhillah

Kedua adikku

Motto

Sesungguhnya setelah kesulitan terdapat kemudahan. Setelah

tangisan terdapat senyuman. Dan segala kesulitan akan

berakhir dengan izin Allah.

v

ABSTRAK

Analisis klaster merupakan salah satu metode multivariate yang bertujuan untuk mengelompokkan objek berdasarkan kemiripan atau ketidakmiripan karakteristiknya, sehingga objek yang terletak pada satu klaster memiliki kemiripan yang lebih besar dibandingkan dengan objek pengamatan yang terletak pada klaster lain. K-means merupakan salah satu metode pengklasteran tidak berhirarki yang paling banyak digunakan, namun karena menggunakan rataan sebagai pusat klasternya, metode ini lebih sensitif terhadap keberadaan pencilan pada data. Metode K-median yang menggunakan median sebagai nilai pusat klasternya dinilai dapat mengatasi adanya pencilan. Penelitian ini bertujuan untuk membandingkan hasil analisis klaster k-means dengan k-median dari data indikator kemiskinan kabupaten di Indonesia tahun 2009.

Hasil pengklasteran menunjukkan bahwa pada metode k-means klaster pertama terdapat 395 kabupaten dan pada klaster kedua terdapat 76 kabupaten. Sedangkan pada metode k-median pada klaster pertama terdapat 99 kabupaten dan pada klaster kedua terdapat 372 kabupaten. Berdasarkan nilai ketepatan klasifikasi klaster K-means memiliki tingkat ketepatan klasifikasi yang lebih baik yaitu sebesar 98,51 Sedangkan pada k-median tingkat ketepatan klasifikasi sebesar 97,57%. Sehingga dapat disimpulkan bahwa pada kasus ini metode pengklasteran k-means lebih baik dibandingkan dengan k-median.

Kata Kunci: Kemiskinan, K-means, K-median

ABSTRACT

Cluster analysis is one of the multivariate method which aims to classify objects based on similarity or dissimilarity its characteristics, so that objects located in one cluster has a similarity larger than the object of observation is located in another cluster. K-means clustering is one method does not berhirarki the most commonly used, but because it uses the mean as the center of the cluster, this method is more sensitive to the presence of outliers in the data. K-medians method that uses the median as a central value can cope with the outliers. This study aimed to compare the results of k-means cluster analysis with k-median of district poverty indicators in Indonesia in 2009.

Clustering results show that the method of k-means clustering, the first cluster there are 395 districts and the second cluster there are 76 districts. While the k-median method, the first cluster there are 99 districts and the second cluster there are 372 districts. Based on the classification accuracy of K-means cluster has the level of a better classification accuracy that is equal to 98.51, while the k-median level of classification accuracy of 97.57%. So it can be concluded that in this case k-means clustering method is better than the k-median.

Keywords : Poverty, K-means, K-median

vii

KATA PENGANTAR

Segala puji dan syukur yang sebesar-besarnya penulis panjatkan kehadirat

Allah SWT, karena dengan rahmat dan karunia-Nya penulis dapat menyelesaikan

tugas akhir ini tepat pada waktunya. Shalawat serta salam semoga selalu tercurah

kepada Nabi Muhammad SAW, keluarga, sahabat serta segenap umatnya.

Penulis sadar bahwa skripsi ini tidak akan selesai bila penulis tidak

mendapat bantuan dari berbagai pihak, baik bantuan secara langsung maupun

dukungan moril dan doa. Oleh karena itu penulis ingin mengucapkan terima kasih

yang sebesar-besarya kepada:

1. Dr. Syopyansyah Jaya Putra, M.Si, Dekan Fakultas Sains dan Teknologi UIN

Syarif Hidayatullah Jakarta.

2. Ibu Yanne Irene, M.Si, Ketua Program Studi Matematika dan Ibu Suma’inna,

M.Si, Sekretaris Program Studi Matematika.

3. Ibu Suma’inna, M.Si, sebagai Dosen Pembimbing I, yang telah meluangkan

waktunya untuk memberikan bimbingan dan pengarahan hingga

terselesaikannya skripsi ini.

4. Bapak Bambang Ruswandi, M.Stat, sebagai Dosen Pembimbing II, atas

bimbingan, saran dan bantuannya dari awal hingga terselesaikannya skripsi

ini.

5. Ayahanda tercinta yang telah menghabiskan waktu dan tenaga tanpa

mengenal batas untuk memberikan yang terbaik bagi penulis agar dapat

meraih cita-cita serta segenap kasih sayang dan perhatiannya.

viii

6. Ibunda tercinta yang selalu memberikan semagat dan dukungan kepada

penulis, atas doa, kasih sayang, dorongan, pengertian dan kesabaran yang tak

terkira hingga penulis dapat menyelesaikan skripsi ini.

7. Seluruh dosen jurusan Matematika, Fakultas Sains dan Teknologi UIN Syarif

Hidayatullah Jakarta yang telah memberikan segenap ilmu.

8. Fitriana Fadhillah yang telah meluangkan banyak waktunya untuk membantu

menyelesaikan skripsi ini serta memberikan dukungan moril dan kesabaran.

9. Dua adikku, seluruh keluarga besarku dan keluarga Dhila yang telah

memberikan perhatian, dukungan dan doanya.

10. Seluruh karyawan dan murid Primagama Pondok Cabe yang selalu

memberikan dorongan motivasi kepada penulis hingga terselesaikan skripsi

ini.

11. Seluruh teman-teman Matematika 2007 yang penuh kekeluargaan dan selalu

memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini.

Penulis menyadari dalam skripsi ini masih terdapat banyak kekurangan.

Penulis mengharapkan kritik dan saran agar penulis dapat memperbaiki

kekurangan yang ada. Penulis berharap semoga tugas akhir ini bermanfaat bagi

penulis khususnya, dan pihak lain umumnya.

Jakarta, Juni 2011

Penulis

ix

DAFTAR ISI

HALAMAN JUDUL ..................................................................................... i

PENGESAHAN PEMBIMBING ................................................................. ii

PENGESAHAN UJIAN ............................................................................... iii

PERNYATAAN ............................................................................................ iv

PERSEMBAHAN DAN MOTTO

ABSTRAK ..................................................................................................... v

ABSTRACT ................................................................................................... vi

KATA PENGANTAR ................................................................................... vii

DAFTAR ISI ................................................................................................. ix

DAFTAR TABEL ......................................................................................... xi

DAFTAR LAMPIRAN ................................................................................. xii

BAB I PENDAHULUAN ......................................................................... 1

1.1. Latar Belakang ......................................................................... 1

1.2. Permasalahan ........................................................................... 3

1.3. Pembatasan Masalah ................................................................ 3

1.4. Tujuan Penelitian ..................................................................... 4

1.5. Manfaat Penelitian ................................................................... 4

BAB II LANDASAN TEORI .................................................................... 6

2.1. Kesejahteraan .......................................................................... 6

2.2. Kemiskinan .............................................................................. 6

2.3. Analisis Klaster ........................................................................ 9

x

2.4. Ukuran Kemiripan .................................................................... 10

2.5. K-means Klaster ..................................................................... 11

2.6. K-median Klaster .................................................................... 12

2.7. Analisis Diskriminan ............................................................... 13

BAB III METODOLOGI PENELITIAN ................................................... 16

3.1. Sumber Data ........................................................................... 16

3.2. Variabel Penelitian ................................................................. 16

3.3. Uji Multikolinieritas ............................................................... 18

3.4. Uji Normal Multivariate ......................................................... 18

3.5. Metode Kerja ........................................................................... 19

3.6. Alur Penelitian ......................................................................... 23

BAB IV HASIL DAN PEMBAHASAN ..................................................... 24

4.1. Deskripsi Data ........................................................................ 24

4.2. Pengujian Asumsi Multikolinieritas ....................................... 25

4.3. Pembentukan Klaster K-means .............................................. 25

4.4. Pembentukan Klaster K-median ............................................. 29

4.5. Analisis Diskriminan .............................................................. 33

BAB V KESIMPULAN DAN SARAN .................................................... 37

5.1. Kesimpulan ............................................................................. 37

5.2. Saran ....................................................................................... 38

DAFTAR PUSTAKA .................................................................................... 39

LAMPIRAN .................................................................................................. 41

xi

DAFTAR TABEL

Tabel 4.1 : Deskripsi Data ............................................................................ 24

Tabel 4.2 : Nilai VIF Setiap Variabel ............................................................. 25

Tabel 4.3 : Jumlah Anggota Setiap Klaster K-means...................................... 25

Tabel 4.4 : Rata-rata Setiap Variabel Pada Klaster 1 ................................... 26


Tabel 4.6 : Variansi Setiap Variabel .............................................................. 28

Tabel 4.7 : Jumlah Anggota Setiap Klaster K-median.................................... 29


Tabel 4.9 : Rata-rata Setiap Variabel Pada Klaster 2 .................................. 31

Tabel 4.10 : Variansi Setiap Variabel ............................................................. 32

Tabel 4.11 : Ketepatan Klasifikasi K-means .................................................. 34

Tabel 4.12 : Ketepatan Klasifikasi K-median ................................................ 35

xii

DAFTAR LAMPIRAN

Lampiran 1 : Hasil Pengklasteran .................................................................. 41

Lampiran 2 : Output Nilai Variance Inflation Factor (VIF) ........................... 54

Lampiran 3 : Perhitungan Nilai ߪଶ Pada K-means ........................................ 54

Lampiran 4 : Perhitungan Nilai ߪଶ Pada K-median ...................................... 55

Lampiran 5 : Ketepatan Klasifikasi K-means ................................................ 56

Lampiran 6 : Ketepatan Klasifikasi K-median .............................................. 57

Lampiran 7 : Perhitungan rata-rata setiap variabel pada klaster k-means ...... 57

Lampiran 8 : Perhitungan rata-rata setiap variabel pada klaster k-median ...... 57

1

BAB I

PENDAHULUAN

1.1 Latar belakang

Kesejahteraan merupakan tumpuan harapan dan menjadi cita-cita

luhur perjuangan bangsa Indonesia sejak proklamasi kemerdekaan. Selain

itu kesejahteraan merupakan hal yang menentukan suatu pembangunan di

suatu daerah. Kesejahteraan masyarakat diharapkan meningkat dari tahun ke

tahun.

Salah satu masalah di bidang kesejahteraan adalah kemiskinan.

Kemiskinan menjadi permasalahan yang dihadapi oleh semua negara di

dunia, terutama di negara yang sedang berkembang seperti halnya

Indonesia. Hingga tahun 2010, BPS memperkirakan hampir 13,33% dari

total penduduk Indonesia masih hidup dalam kondisi miskin.

Indonesia memiliki potensi yang luar biasa dengan segala sumber

daya yang ada. Seharusnya hal ini dapat dimanfaatkan dengan baik oleh

pemerintah dalam meningkatkan kesejahteraan masyarakat Indonesia.

Namun kenyataannya permasalahan kemiskinan menjadi salah satu

permasalahan yang cukup penting di Indonesia. Kondisi ini menggambarkan

bahwa kemiskinan merupakan masalah sosial, baik di tingkat nasional

maupun regional dan perlu mendapatkan penanganan yang serius dari

seluruh masyarakat. Oleh karena itu permasalahan kemiskinan harus segera

diatasi.

2

Kemiskinan terjadi bukan hanya karena rendahnya pendapatan tetapi

juga karena keterbatasan sarana dan prasarana rumah tangga. Suatu rumah

tangga tidak memiliki fasilitas buang air besar belum tentu dapat dikatakan

miskin karena tingkat perekonomiannya cukup tinggi. Hal ini terjadi karena

rumah tangga tersebut menerapkan pola kehidupan tempat tinggalnya.

Selama ini pemerintah telah berupaya mengatasi permasalahan

kemiskinan. Salah satunya yaitu dengan memberikan bantuan kepada rumah

tangga miskin antara lain dengan memberikan bantuan langsung tunai

(BLT), pemberian kartu jaminan kesehatan dan lain sebagainya. Namun

permasalahan mendasar yang sangat penting dan dapat mengganggu

keberhasilan program ini adalah salah sasaran (mis-targeting). Salah satu

penyebabnya adalah belum adanya informasi mengenai kondisi aktual

kemiskinan pada setiap kabupaten.

Untuk mengatasi hal tersebut, pemerintah memerlukan gambaran

kondisi sosial ekonomi kabupaten/kota di Indonesia berupa kegiatan

evaluasi dan studi kasus yang dapat mengelompokkan kabupaten-kabupaten

di Indonesia untuk mengetahui karakteristik kabupaten tersebut dalam

bidang kemiskinan. Sehingga dapat menentukan kabupaten mana saja yang

diprioritaskan untuk mendapatkan bantuan dari pemerintah.

Dalam statistika, salah satu metode yang digunakan untuk

mengelompokkan variabel atau objek adalah analisis klaster. Analisis

klaster merupakan suatu metode untuk mengelompokkan variabel atau

objek ke dalam beberapa kelompok. Setiap unit pengamatan dalam satu

3

kelompok akan mempunyai ciri yang relatif sama sedangkan antar

kelompok unit pengamatan memiliki sifat yang berbeda [1].

Ada beberapa metode pengelompokkan dalam analisis klaster, antara

lain k-means klaster dan k-median klaster. Berdasarkan penelitian Yanne

Flowrensia (2010) pada kasus pengelompokkan karakteristik tanaman bunga

iris, metode pengelompokkan k-median lebih baik dibandingkan k-means

dalam pengelompokkan data yang mengandung outlier [5] .

Pengelompokkan ini bermanfaat bagi pemerintah dalam menentukan

kabupaten mana saja yang diprioritaskan untuk mendapatkan bantuan. Oleh

karena itu penulis tertarik untuk melakukan penelitian mengenai hal tersebut

dengan judul “ Analisis Klaster K-Means dan K-Median pada data

indikator kemiskinan studi kasus data indikator kemiskinan kabupaten

di Indonesia Tahun 2009”.

1.2 Permasalahan

Rumusan masalah penelitian ini dapat dirinci ke dalam beberapa

pertanyaan penelitian sebagai berikut :

1. Bagaimana hasil pengklasifikasian K-Means dan K-Median.

2. Kabupaten mana saja di Indonesia yang diprioritaskan untuk

mendapatkan bantuan dari pemerintah untuk periode 2010 hingga 2015.

1.3 Pembatasan Masalah

Agar dalam pembahasan tidak terlalu luas dan hasilnya dapat

mendekati pokok permasalahan, maka dalam penelitian ini hanya

membahas pengelompokkan pada data kemiskinan kabupaten di Indonesia

4

tahun 2009 serta analisis yang dilakukan berdasarkan data-data yang

diperoleh pada waktu penelitian.

1.4 Tujuan Penelitian

Penelitian ini dilakukan dengan tujuan sebagai berikut :

1. Untuk membandingkan hasil klasifikasi K-Means dengan hasil

klasifikasi K-Median.

2. Mengelompokkan kabupaten-kabupaten di Indonesia berdasarkan

indikator kemiskinan untuk mengetahui kabupaten mana yang perlu

mendapatkan prioritas bantuan dari pemerintah agar program

pemerintah tepat sasaran.

1.5 Manfaat Penelitian

Hasil penelitian ini diharapkan dapat digunakan untuk :

1. Manfaat Teoritis

Dapat digunakan sebagai bahan referensi untuk penelitian lanjutan,

dengan tema yang sama akan tetapi dengan metode dan teknik analisa

yang berbeda. Sehingga dapat dilakukan proses verifikasi demi kemajuan

ilmu pengetahuan.

2. Manfaat Praktis

a. Bagi pemerintah

Sebagai dasar untuk menentukan kabupaten mana saja yang harus

diprioritaskan untuk mendapat bantuan, sehingga tidak terjadi lagi

salah sasaran.

5

b. Bagi penulis

Hasil penelitian ini dapat dijadikan bahan temuan awal untuk

melakukan penelitian lebih lanjut mengenai indikator-indikator

kemiskinan, serta dapat menerapkan ilmu-ilmu yang telah didapat

selama kuliah.

c. Bagi pembaca

Hasil penelitian diharapkan dapat digunakan sebagai bahan bacaan

dan acuan bagi pembaca yang sedang melakukan penelitian di bidang

kemiskinan.

6

BAB II

TINJAUAN PUSTAKA

2.1 Kesejahteraan

Kesejahteraan mencakup bidang-bidang kehidupan yang sangat luas

dan semua aspeknya tidak dapat diukur. Sebuah keluarga dapat dikatakan

sejahtera apabila seluruh kebutuhan jasmani dan rohani dari keluarga

tersebut dapat terpenuhi sesuai dengan tingkat hidup masing-masing

keluarga [2].

Kesejahteraan dalam konsep dunia modern adalah sebuah kondisi

dimana seorang dapat memenuhi kebutuhan pokok, baik itu kebutuhan akan

makanan, pakaian, tempat tinggal, air minum yang bersih serta kesempatan

untuk melanjutkan pendidikan dan memiliki pekerjaan yang memadai yang

dapat menunjang kualitas hidupnya sehingga memiliki status sosial yang

mengantarkan pada status sosial yang sama terhadap sesama warga lainnya

[2].

2.2 Kemiskinan

Masalah sosial bersifat relatif, namun secara pasti banyak sekali

permasalahan sosial yang terjadi dalam masyarakat Indonesia. Untuk

memudahkan penanganannya, pemerintah mengklasifikasikan masalah

sosial dalam lima masalah utama, yaitu kemiskinan, kecacatan,

keterlantaran, ketunaan sosial, dan kebencanaan. Namun di antara kelima

7

masalah sosial tersebut, kemiskinan merupakan akar utama terjadinya

seluruh permasalahan sosial.

BPS mendasarkan pada besarnya Rupiah yang dibelanjakan

perkapita perbulan untuk memenuhi kebutuhan minimum makanan dan non

makanan. Kebutuhan minimum makanan menggunakan patokan 2100 kalori

perhari. Kebutuhan non makanan meliputi perumahan, sandang, aneka

barang dan jasa. Pengeluaran bukan makanan dibedakan antara perkotaan

dan pedesaan. Pola ini telah dianut oleh BPS sejak tahun 1976.

Kemiskinan adalah keadaan dimana terjadi kekurangan hal-hal yang

biasa untuk dimiliki seperti makanan, pakaian, tempat berlindung, dan air

minum, hal ini berhubungan erat dengan kualitas hidup. Secara konseptual,

kemiskinan dapat dikategorikan menjadi dua, yaitu :

1. Kemiskinan kronis (chronic poverty) yang terjadi secara simultan atau

disebut juga sebagai kemiskinan struktural. Fakir miskin atau rumah

tangga miskin memerlukan penanganan yang menyeluruh, terpadu secara

lintas sektor, dan berkelanjutan.

2. Kemiskinan sementara (transient poverty) yang ditandai dengan

menurunnya pendapatan dan kesejahteraan masyarakat secara sementara

sebagai akibat dari perubahan kondisi normal menjadi kondisi kritis,

bencana alam dan bencana sosial, seperti korban konflik sosial.

Kemiskinan sementara jika tidak ditangani secara serius dapat menjadi

kemiskinan kronis.

8

Kemiskinan memiliki beberapa ciri sebagai berikut :

1. Ketidakmampuan memenuhi kebutuhan konsumsi dasar (pangan,

sandang dan papan).

2. Ketiadaan akses terhadap kebutuhan hidup dasar lainnya (kesehatan,

pendidikan, sanitasi, air bersih dan transportasi).

3. Ketiadaan jaminan masa depan (karena tiadanya investasi untuk

pendidikan dan keluarga).

4. Kerentanan terhadap goncangan yang bersifat individual maupun massal.

5. Rendahnya kualitas sumber daya manusia dan keterbatsaan sumber alam.

6. Ketidakterlibatan dalam kegiatan sosial masyarakat.

7. Ketiadaaan akses terhadap lapangan kerja dan mata pencaharian yang

berkesinambungan.

8. Ketidakmampuan untuk berusaha karena cacat fisik maupun mental.

9. Ketidakmampuan dan ketidaksinambungan sosial (anak terlantar, wanita

korban tindak kekerasan rumah tangga, janda miskin, kelompok marjinal

dan terpencil).

Terdapat 14 indikator kemiskinan yaitu luas lantai, jenis lantai, jenis

dinding, fasilitas buang air besar, sumber air minum, sumber penghasilan

kepala rumah tangga, sumber penerangan rumah tangga, jenis bahan bakar

untuk memasak setiap hari, frekuensi pembelian pakaian baru dalam

setahun, frekuensi mengkonsumsi daging atau susu dalam seminggu,

9

frekuensi makan dalam sehari, biaya kesehatan, pendidikan tertinggi kepala

rumah tangga, dan tabungan [12].

2.3 Analisis Klaster

Analisis klaster merupakan teknik multivariate (banyak variabel)

yang berfungsi mengelompokkan beberapa variabel atau objek [9]. Dalam

analisis klaster, ingin mengetahui pengaruh dari setiap variabel bebas, baik

secara individu maupun bersama terhadap variabel tidak bebas.

Tujuan utama analisis klaster adalah mengklasifikasi objek seperti

orang, produk atau barang, perusahaan, ke dalam kelompok-kelompok yang

homogeny dan didasarkan pada suatu set variabel yang dipertimbangkan

untuk diteliti. Pembentukan klaster didasarkan pada kuat tidaknya hubungan

antar variabel. Suatu objek dimasukkan ke dalam suatu klaster atau

kelompok sehingga lebih berhubungan (berkorelasi) dengan objek lainnya

di dalam klasternya dibandingkan dengan objek di klaster lain.

Terdapat dua metode dalam analisis klaster, yaitu metode hirarki dan

metode non-hirarki. Pada metode non-hirarki umumnya digunakan jika

banyaknya satuan pengamatan besar dan banyaknya klaster telah ditentukan

sebelumnya. Sedangkan pada metode hirarki banyaknya satuan pengamatan

tidak begitu besar dan banyaknya klaster tidak ditentukan sebelumnya.

10

2.4 Ukuran Kemiripan

Ukuran kemiripan yang biasa digunakan dalam analisis klaster

adalah jarak Euclidean dan jarak Mahalanobis [4]. Jarak Euclidean

digunakan jika variabel amatan saling bebas atau tidak berkorelasi satu

sama lain (tidak terjadi multikolinieritas). Namun jika terjadi

multikolinieritas, dapat diatasi dengan mentransformasi data menggunakan

Principle Component Analysis (PCA) karena bila data yang digunakan

dalam analisis klaster adalah data skor komponen dari hasil PCA, maka

tidak akan ditemukan lagi adanya Multikolinieritas [7]. Jarak Euclidean

dirumuskan sebagai berikut :

d(i,j) = ∑ ( 푥 − 푥 ) i= 1...471 ; j = 1 ... 7 (2.1)

dimana d(i,j) = jarak antara objek i dan objek j

xik = nilai objek i pada variabel ke k

xjk = nilai objek j pada variabel ke k

p = banyak variabel yang diamati

Jika terjadi multikolinieritas selain dengan mentransformasi data

dengan PCA dapat juga menggunakan ukuran jarak Mahalanobis. Jarak

Mahalanobis dirumuskan sebagai berikut :

d(i,j) = 풙풊풌 − 풙풋풌 푆 ( 풙풊 − 풙풋) 푖 = 1,2,3, . .471; 푗 = 1,2,3, . . ,7 (2.2)

dengan xi dan xj sebagai vektor dari nilai objek i dan j, sedangkan S

merupakan matriks kovarian.

11

2.5 K-Means Klaster

K-Means merupakan metode pengelompokkan yang paling terkenal

dan banyak digunakan di berbagai bidang karena sederhana dan mudah

diimplementasikan. K-means merupakan metode pengklasteran secara

partitioning yang memisahkan data ke dalam kelompok yang berbeda.

K-means merupakan salah satu metode pengelompokkan data

nonhirarki yang berusaha membagi data yang ada ke dalam bentuk dua atau

lebih kelompok [13]. Metode ini dikembangkan oleh Mac Queen pada tahun

1967.

Tujuan dari pengelompokkan data ini adalah untuk

meminimalisasikan fungsi objektif dalam proses pengelompokkan, yang

pada umumnya berusaha meminimalisasikan ragam di dalam suatu

kelompok dan memaksimalkan ragam antar kelompok.

Dasar algoritma K-means adalah sebagai berikut :

1. Diberikan nilai k sebagai jumlah klaster yang ingin dibentuk.

2. Bangkitkan k centroid (titik pusat klaster) awal secara random.

3. Hitung jarak setiap data ke masing-masing pusat klaster yaitu

menggunakan Euclidean Distance.

4. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan

pusatnya.

5. Tentukan posisi pusat klaster baru (Ckj) dengan cara menghitung nilai

rata-rata dari data-data yang ada pada pusat klaster yang sama.

퐶 = ⋯

푗 = 1,2, … ,7 (2.3)

12

퐶 = pusat klaster ke-k pada variabel ke-j

푎 = banyak data pada klaster ke-k

2.6 K-Median Klaster

K-median merupakan salah satu metode dalam pengelompokkan.

Namun jika pada K-means pengelompokkan berdasarkan nilai rataannya,

pada K-median pengelompokkan didasarkan pada nilai mediannya [8].

Misalkan terdapat N buah data, jarak antara objek ke-i, 푥 dan objek

ke-j, 푥 dinotasikan dengan 퐶 . Dalam pemilihan suatu objek yang

representatif dalam suatu klaster (median awal), 푦 didefinisikan sebagai

variabel biner 0 dan 1, dimana y = 1 jika objek ke-i dipiih sebagai median

awal. Penempatan setiap objek ke-j ke salah satu median awal dituliskan

sebagai 푋 , dengan 푋 bernilai 0 dan 1. Jika objek j ditempatkan ke klaster

dimana objek i sebagai median maka 푋 = 1.

Berdasarkan definisi di atas, maka :

min ∑ ∑ 퐶 푋 (2.4)

dengan ` ∑ 푋 = 1 , ∀ 푗 ∈ 푁 (2.5)

푋 ≤ 푦 ∀ 푖, 푗 ∈ 푁 (2.6)

∑ 푦 = 푘 , 푘 = jumlah klaster (2.7)

푋 ∈ {0,1} ,∀ 푖, 푗 ∈ 푁 (2.8)

푦 ∈ {0,1} ,∀ 푖 ∈ 푁 (2.9)

13

Persamaan (2.4) menyatakan bahwa klaster yang terbentuk dengan

menempatkan setiap objek ke median yang terdekat. Persamaan (2.5)

menyatakan bahwa setiap objek ditempatkan pada sebuah median.

Persamaan (2.6) menyatakan bahwa penempatan objek didasarkan pada

median. Persamaan (2.7) menyatakan bahwa hanya terdapat sebuah objek

yang akan dipilih median.

Dasar algoritma K-median adalah sebagai berikut :

1. Diberikan nilai k sebagai jumlah klaster yang ingin dibentuk.

2. Bangkitkan k centroid (titik pusat klaster) awal secara random.

3. Hitung jarak setiap data ke masing-masing pusat klaster yaitu

menggunakan Euclidean Distance.

4. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan

pusatnya.

5. Tentukan posisi pusat klaster baru (Ck) dengan cara menghitung nilai

median data-data yang ada pada pusat klaster yang sama.

2.7 Analisis Diskriminan

Analisis Diskriminan merupakan suatu analisis dengan tujuan

membentuk sejumlah fungsi melalui kombinasi linear variabel-variabel asal,

yang dapat digunakan sebagai cara terbaik untuk memisahkan kelompok-

kelompok individu. Fungsi yang terbentuk melalui analisis ini selanjutnya

dinamakan fungsi diskriminan [11].

Analisis diskriminan dapat digunakan jika variabel terikat terdiri dari

dua kelompok. Apabila klasifikasi terdiri dari tiga kelompok atau lebih

14

maka teknik yang digunakan adalah analisis diskriminan multipel (multiple

discriminant analysis).

Analisis diskriminan menghubungkan satu variabel terikat (non

metrik, nominal atau ordinal) dengan satu atau beberapa variabel bebas

sebagai prediktor yang merupakan metrik (interval atau rasio).

Tujuan analisis diskriminan adalah sebagai berikut :

1. Membuat suatu fungsi diskriminan atau kombinasi linier dari prediktor

atau variabel bebas yang bisa mendiskriminasi atau membedakan

kategori variabel terikat atau kelompok. Artinya mampu membedakan

suatu objek masuk kelompok atau kategori yang mana.

2. Menguji apakah ada perbedaan signifikan antar kelompok dikaitkan

dengan variabel bebas atau prediktor.

3. Menentukan prediktor atau variabel bebas mana yang memberikan

sumbangan terbesar terhadap terjadinya perbedaan antar kelompok.

4. Mengklasifikasi objek ke dalam suatu kelompok didasarkan pada nilai

variabel bebas.

5. Mengevaluasi keakuratan klasifikasi.

Adapun dalam penelitian ini tujuan yang ingin dicapai yaitu untuk

mengevaluasi keakuratan dalam mengklasifikasi.

15

Untuk menghitung seberapa besar ketepatan klasifikasi terdapat

beberapa metode, salah satunya adalah Appearent Error Rate (APER).

APER adalah persentase kesalahan yang dikelompokkan salah. APER

dihitung berdasarkan persamaan sebagai berikut :

(2.10)

1

1

l

jMj

l

jj

nAPER

n

16

BAB III

METODOLOGI PENELITIAN

3.1 Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder hasil

Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2009 yang

dilaksanakan oleh Badan Pusat Statistik (BPS). Data yang digunakan berupa

data indikator kemiskinan untuk seluruh kabupaten/kota di seluruh

Indonesia, yang terdiri dari 471 kabupaten atau kota. Data tersebut

disesuaikan dengan ketersediaan data yang ada.

3.2 Variabel Penelitian

Variabel-variabel yang digunakan pada penelitian ini dibagi dalam

beberapa bidang sebagai berikut :

a. Variabel Bidang Pekerjaan

Pengelompokkan pekerjaan dibedakan dalam dua kelompok yaitu

bekerja di bidang formal dan informal. Pekerja sektor formal adalah

seseorang yang bekerja dengan dibantu karyawan/pegawai tetap atau

bekerja sebagai karyawan/pegawai. Sedangkan pekerja di sektor

informal adalah seseorang yang berusaha sendiri, berusaha dengan

buruh tidak tetap atau buruh tidak dibayar.

b. Variabel Fasilitas Perumahan

Sebuah rumah dikategorikan rumah sehat apabila luas lantai

perkapita yang ditempati minimal sebesar 8 m2 [2].

17

Rumah tangga pengguna air bersih adalah persentase rumah

tangga yang menggunakan air minum yang berasal dari air mineral, air

leding atau PAM, pompa air, sumur atau mata air terlindung dengan

jarak ke penampungan lebih dari 10 meter.

c. Variabel Program Pemerintah

Beras untuk masyarakat miskin (Raskin) adalah salah satu

program pemerintah untuk membantu rakyat miskin dalam memenuhi

kebutuhan makanan sehari-hari. Raskin diselenggarakan oleh Badan

Urusan Logistik (Bulog) dengan cara menjual beras dengan harga

murah bersubsidi.

Variabel yang digunakan dalam penelitian ini disesuaikan dengan

ketersediaan data. Berikut adalah variabel-variabel yang digunakan:

X1 : jumlah penduduk miskin yang bekerja di bidang formal.

X2 : jumlah penduduk miskin bekerja di bidang informal.

X3 : jumlah rumah tangga dengan luas lantai kurang dari 8 m2.

X4 : jumlah rumah tangga dengan luas lantai lebih dari 8 m2.

X5 : jumlah rumah tangga menggunakan air bersih.

X6 : jumlah rumah tangga menggunakan jamban sendiri.

X7 : jumlah rumah tangga penerima raskin.

18

3.3 Uji Multikolinieritas

Uji multikolinieritas dilakukan untuk mengetahui ada tidaknya

korelasi antar variabel. Uji multikolinieritas dilakukan dengan

menggunakan nilai Variance inflation factor (VIF). Jika nilai VIF lebih

besar dari 5, maka variabel tersebut mempunyai permasalahan

multikolinieritas dengan variabel bebas lainnya [10].

3.4 Uji Normal Multivariate

Pengujian asumsi normal multivariate dilakukan pada masing-

masing data tiap klaster untuk mengetahui apakah data pada tiap klaster

tersebut menyebar mengikuti sebaran normal multivariate, dengan langkah-

langkah sebagai berikut :

a. Menghitung jarak Mahalanobis (di2) pada kelompok ke-i dengan

persamaan :

di2 = (xi - 풙횤)T S-1 (xi - 풙횤) i = 1, 2, ..., n (3.1)

di2 = jarak Mahalanobis

xi = vektor kolom berisi nilai-nilai pengamatan

풙횤 = vektor kolom berisi rataan kelompok ke-i

S = matriks kovarians

b. Mengurutkan di2 dari yang terkecil ke terbesar sehingga d1

2 < d22 < .... <

dn2 dengan n menyatakan jumlah amatan.

c. Untuk setiap nilai di2, dihitung ( , )

d. Mencari nilai χ2 untuk setiap persentil dari sebaran χ2 dengan p derajat

bebas pada tabel Khi-kuadrat.

19

e. Membuat plot antara χ2 dengan di2

Jika x ~ Np (풙, 푺) maka (xi - 풙횤)t S-1 (xi - 풙횤) ~ χ2 (p)

Apabila plot antara jarak Mahalanobis dan Khi-kuadrat mengikuti

pola garis lurus maka dapat dikatakan bahwa data berdistribusi normal

multivariate [6].

3.5 Metode Kerja

Setelah data diperoleh, langkah selanjutnya adalah melakukan

analisis data dengan menggunakan metode K-Means klaster dan K-Median

klaster. Tahapan analisis yang dilakukan sebagai berikut :

1. Menentukan banyaknya klaster yang akan dibentuk.

Dalam penelitian ini klaster yang ingin dibentuk adalah 2 klaster.

2. Lakukan metode pengklasteran K-Means dan K-Median dengan k klaster

yang didapat pada langkah 1. Tahapan yang dilakukan pada metode k-

means adalah sebagai berikut :

a. Menentukan pusat klaster awal secara acak.

b. Menghitung jarak antara setiap objek dengan pusat klaster

c. Masukkan tiap objek ke satu klaster yang memiliki jarak terdekat

dengan pusat klasternya.

d. Menghitung kembali pusat klaster yang terbentuk.

e. Ulangi dari langkah b sampai tidak ada perpindahan objek antar

klaster.

20

3. Mendeskripsikan karakteristik klaster.

Dalam mendeskripsikan klaster digunakan persamaan

X =∑

i = 1,2,3...n j=1,2,3...q (3.2)

dengan X = Rata-rata sampel (rata-rata variabel pada klaster tertentu).

nj = banyak anggota pada klaster ke-j.

xij = nilai data ke-i pada variabel ke-j

4. Uji Variance

Uji Variance dilakukan untuk melihat apakah variabel-variabel yang

telah membentuk klaster memiliki perbedaaan pada tiap klaster, serta

untuk melihat variabel yang paling berpengaruh terhadap pembentukan

klaster [9]. Hal ini dapat dilihat dengan menggunakan konsep sebagai

berikut :

푦 = 푖 = 1,2 (3.3)

푦 = rata-rata setiap variabel pada klaster ke-i

푀 = jumlah anggota pada klaster ke-i

푦 = ∑ ∑ (3.4)

푦 = rataan populasi dari variabel

푁 = banyaknya klaster

푦 = (3.5)

푦 = rata-rata populasi

푦 = nilai data ke-j pada variabel ke-k

21

휎 = ∑ ( ) 푖 = 1,2 (3.6)

휎 = variansi pada klaster ke-i

푦 = nilai data ke-j pada klaster ke-i

Internal homogenity variance within cluster (휎 ).

휎 = ∑ (3.7)

휎 = variansi dalam klaster

External homogenity variance between cluster (휎 ).

휎 = ∑ ( ) (3.8)

휎 = variansi antar klaster

휎 = (3.9)

Semakin besar nilai 휎 suatu variabel, maka semakin besar perbedaan

variabel tersebut pada ketiga klaster yang terbentuk. Hal ini dapat

digunakan sebagai metode pembanding untuk mengetahui metode

pengelompokkan mana yang lebih baik. Semakin besar nilai 휎 pada

setiap variabel maka semakin baik metode pengelompokkan tersebut.

5. Analisis Diskriminan

Analisis Diskriminan digunakan sebagai metode pembanding dalam

mengetahui seberapa besar ketepatan pengklasteran antara metode k-

means dengan k-median. Hal ini dapat dilihat dari besar nilai ketepatan

klasifikasi. Jika nilai ketepatan klasifikasi semakin besar, maka

22

pengklasteran semakin baik. Sedangkan jika nilai ketepatan klasifikasi

semakin kecil, maka pengklasteran kurang baik.

Tabel 3.1. Tabel klasifikasi

D Prediksi Total 1 2

Aktual 1 C11 C12 C11+C12 2 C21 C22 C21+C22

D = diskriminan

Menghitung seberapa besar ketepatan klasifikasi dengan

menggunakan Correct Classification Rate (CCR). CCR merupakan

persentase ketepatan nilai amatan dan dugaannya, CCR dihitung dengan

persamaan sebagai berikut :

CCR = Jumlah prediksi yang tepat x 100% Jumlah data

CCR = , , ∑ ∑

x 100% (3.10)

Menghitung persentase kesalahan dalam klasifikasi dihitung

menggunakan APER yaitu sebagai berikut :

APER = , ,

∑ ∑ x 100% (3.11)

Semakin kecil nilai APER maka tingkat ketepatan klasifikasi

semakin baik.

23

3.6 Alur Penelitian

Gambar 3.1 Alur penelitian

Setelah data diperoleh langkah selanjutnya adalah menentukan

banyaknya klaster yang ingin dibentuk, kemudian dilakukan analisis

klaster k-means dan k-median, dan membandingkan nilai ketepatan

klasifikasi kedua metode tersebut dengan menggunakan metode analisis

diskriminan dan uji variance.

Mulai

Mengumpulkan Data

Analisis Klaster 1. K-Means 2. K-Median

Menghitung ketepatan klasifikasi

Menentukan Banyaknya klaster

Selesai

Membandingkan hasil klasifikasi dengan metode analisis diskriminan dan uji variance

24

BAB IV

HASIL DAN PEMBAHASAN

4.1 Deskripsi data

Berikut adalah deskripsi statistik yang digunakan untuk melihat

gambaran dari data.

Tabel 4.1. Deskripsi data

Variabel Rataan Ragam

Jumlah penduduk miskin yang bekerja di bidang formal (X1) 14.739,49 469.459.833,04 Jumalah penduduk miskin yang bekerja di bidang informal (X2) 50.372,92 3.619.953.702,63 Jumlah rumah tangga dengan luas lantai kurang dari 8 m2 (X3) 25.890,00 923.186.607,24 Jumlah rumah tangga dengan luas lantai lebih dari 8 m2 (X4) 25.497,21 1.292.524.266,99 Jumlah rumah tangga menggunakan air bersih (X5) 28.565,88 1.525.767.394,16 Jumlah rumah tangga menggunakan jamban sendiri (X6) 37.728,63 2.320.940.940,61 Jumlah rumah tangga penerima raskin (X7) 52.043,21 4.920.493.964,93

Berdasarkan Tabel 4.1 terlihat bahwa secara rata-rata sebagian besar

penduduk miskin di indonesia bekerja di bidang informal yaitu sebesar

50.372 jiwa. Selain itu jumlah penerima raskin juga masih cukup tinggi

yaitu sebesar 52.043 rumah tangga.

25

4.2 Pengujian Asumsi Multikolinieritas

Sebelum dilakukan pengklasteran, dilakukan uji asumsi

Multikolinieritas untuk mengetahui ukuran kemiripan apa yang dapat

digunakan. Pengujian multikolinieritas didapat hasil sebagai berikut :

Tabel 4.2. Nilai VIF setiap variabel

Variabel VIF X1 2,915 X2 3,232 X3 2,473 X4 2,147 X5 1,629 X6 1,593 X7 1,201

Berdasarkan Tabel 4.2 terlihat bahwa nilai VIF untuk setiap variabel

bernilai kurang dari 5. Sehingga dapat disimpulkan bahwa tidak terjadi

multikolinieritas pada variabel-variabel tersebut. Oleh karena itu, dalam

melakukan pengklasteran dapat menggunakan jarak Euclidean.

4.3 Pembentukan Klaster K-Means

Hasil pengklasteran dengan menggunakan metode K-means adalah

sebagai berikut :

a. Jumlah Anggota Klaster

Tabel 4.3. Jumlah anggota pada setiap klaster k-means

Klaster jumlah anggota 1 395 2 76

jumlah 471

26

Berdasarkan Tabel 4.3 hasil pengklasteran didapat 2 klaster dengan

jumlah anggota pada klaster pertama adalah 395 kabupaten, klaster kedua

adalah 76 kabupaten dari jumlah kabupaten se-Indonesia sebanyak 471

kabupaten.

b. Karakteristik Klaster

Interpretasi karakteristik dari setiap klaster yang terbentuk adalah

sebagai berikut :

1. Klaster satu

Berdasarkan persamaan 3.2 didapat nilai rata-rata setiap variabel

pada klaster pertama adalah sebagai berikut :

Tabel 4.4 Rata-rata variabel pada klaster 1

Variabel Rata-rata pada klaster 1

X1 8.624,63 X2 28.020,66 X3 19.954,52 X4 13.085,13 X5 14.936,59 X6 20.667,26 X7 25.692,72

Berdasarkan Tabel 4.4 terlihat bahwa pada klaster satu sebagian

besar penduduk miskin bekerja di bidang informal yaitu sebesar

28.020 jiwa, sedangkan pada bidang fasilitas rumah tangga klaster

satu beranggotakan kabupaten/kota yang sebagian besar memiliki

rumah dengan luas lantai kurang dari 8 m2 yaitu sebesar 19.954 rumah

tangga.

27

Anggota klaster satu antara lain Kabupaten Simeuleu, Aceh

Tamiang, Aceh Selatan, Aceh Tenggara, Aceh Timur, Sabang,

Jakarta Selatan, Jakarta Utara, Jakarta Barat, dan untuk selengkapnya

terdapat pada lampiran 1.

2. Klaster Dua

Berdasarkan persamaan 3.2 didapat nilai rata-rata setiap variabel

pada klaster kedua adalah sebagai berikut :

Tabel 4.5. Rata-rata variabel pada klaster 2

variabel rata-rata pada klaster 2

X1 46.520,65 X2 166.545,80 X3 58.609,92 X4 90.007,36 X5 99.402,30 X6 126.402,81 X7 188.996,36

Berdasarkan Tabel 4.5 terlihat bahwa pada klaster dua sebagian

besar penduduk miskin bekerja di bidang informal yaitu sebesar

166.545 jiwa, sedangkan pada bidang fasilitas rumah tangga klaster

dua beranggotakan kabupaten/kota yang sebagian besar memiliki

rumah dengan luas lantai lebih dari 8 m2 yaitu sebesar 90.007 rumah

tangga. Namun rumah tangga dengan luas lantai kurang dari 8 m2 pun

masih cukup tinggi yaitu sebesar 58.609 rumah tangga dan masih

banyaknya penduduk miskin yang menerima raskin yaitu sebesar

188.996 rumah tangga.

28

Anggota klaster dua antara lain adalah Aceh Utara, Lampung

Selatan, Cianjur, Garut, Banyumas, Lombok Barat dan untuk

selengkapnya terdapat pada lampiran 1.

Berdasarkan interpretasi kedua klaster tersebut, dapat

disimpulkan bahwa klaster pertama yaitu klaster pekerja informal

dengan fasilitas rumah tangga cukup memadai. Sedangkan klaster

kedua yaitu klaster pekerja informal dengan fasilitas rumah tangga

kurang memadai. Sehingga kabupaten yang ada pada klaster kedua

lebih membutuhkan bantuan dibandingkan dengan kabupaten yang

ada pada klaster pertama.

c. Uji Variance Klaster K-means

Berdasarkan persamaan (3.7), (3.8), dan (3.9) didapat hasil sebagai

berikut :

Tabel 4.6. Variansi setiap variabel

Variabel X1 718.054.355 611.664.319 1,17393533 X2 9.594.606.413 2.024.722.791 4,73872594

X3 761.100.700 1.641.170.185 0,46375489

X4 2.958.515.061 1.180.758.363 2,50560585

X5 3.567.228.316 1.090.978.948 3,26974991

X6 5.590.002.996 1.555.498.689 3,59370473

X7 13.334.040.132 2.846.127.209 4,68497687

Berdasarkan Tabel 4.6 terlihat bahwa nilai

ଶ terbesar ada pada variabel X2 yaitu sebesar 4,73872594, sehinggaߪ

variabel bekerja di bidang informal adalah variabel yang memiliki

29

perbedaan paling berarti pada klaster 1 dan klaster 2 serta merupakan

variabel yang paling berpengaruh terhadap pembentukan klaster.

4.4 Pembentukan Klaster K-Median

Hasil pengklasteran dengan menggunakan metode K-median adalah

sebagai berikut :

a. Jumlah Anggota Klaster

Tabel 4.7. Jumlah anggota pada setiap klaster k-median

Klaster Jumlah anggota

1 99 2 372

jumlah 471

Berdasarkan Tabel 4.7 hasil pengklasteran didapat 2 klaster dengan

jumlah anggota pada klaster pertama adalah 99 kabupaten dan pada

klaster 2 terdapat 372 kabupaten dari jumlah kabupaten se-Indonesia

sebanyak 471 kabupaten.

30

b. Karakteristik Klaster

Interpretasi karakteristik dari setiap klaster yang terbentuk adalah

sebagai berikut :

1. Klaster 1

Berdasarkan persamaan 3.2 didapat nilai rata-rata setiap

variabel pada klaster pertama adalah sebagai berikut :

Tabel 4.8. Rata-rata setiap variabel pada klaster 1


X1 42.360,63 X2 146.597,74 X3 54.288,05 X4 79.376,83 X5 89.883,41 X6 113.601,81 X7 165.693,96

Berdasarkan Tabel 4.8 klaster pertama beranggotakan

kabupaten yang sebagian besar penduduknya bekerja di bidang

informal yaitu sebesar 146.597 jiwa, sedangkan pada bidang fasilitas

rumah tangga klaster pertama beranggotakan kabupaten yang

sebagian besar rumah tangganya memiliki rumah dengan luas lantai

lebih dari 8 m2 yaitu sebesar 79.376 rumah tangga. Namun rumah

tangga dengan luas lantai kurang dari 8 m2 pun masih cukup tinggi

yaitu sebesar 54.288 rumah tangga dan masih banyaknya rumah

tangga yang berstatus sebagai penerima raskin yaitu sebesar 165.693

rumah tangga.

31

Anggota klaster satu antara lain adalah Kabupaten Aceh Utara,

Subang, Banyumas, Lamongan, Lombok Barat, Lombok Timur dan

untuk selengkapnya terdapat pada lampiran 1.

2. Klaster Dua

Berdasarkan persamaan 3.2 didapat nilai rata-rata setiap

variabel pada klaster kedua adalah sebagai berikut :

Tabel 4.9. Rata-rata setiap variabel pada klaster 2


X1 7.388,70 X2 24.764,69 X3 18.332,45 X4 11.158,28 X5 12.247,5 X6 17.536,57 X7 21.797,43

Berdasarkan Tabel 4.9 terlihat bahwa pada klaster kedua

beranggotakan kabupaten yang sebagian besar penduduknya bekerja

di bidang informal yaitu sebesar 24.764 jiwa, sedangkan pada bidang

fasiltas rumah tangga sebagian besar rumah tangga memiliki rumah

dengan luas lantai kurang dari 8 m2, dan rumah tangga penerima

raskin relatif rendah yaitu sebesar 21.797 rumah tangga.

Anggota klaster dua antara lain adalah Kabupaten Simeuleu,

Sabang, Padang, Jakarta Timur, Jakarta Pusat, Kota Bogor dan untuk

selengkapnya terdapat pada lampiran 1.

32

Berdasarkan interpretasi kedua klaster tersebut, dapat disimpulkan

bahwa klaster pertama adalah klaster pekerja informal dengan fasilitas

rumah tangga kurang memadai, sedangkan klaster kedua adalah klaster

pekerja informal dengan fasilitas rumah tangga cukup memadai. Sehingga

kabupaten yang ada pada klaster pertama lebih membutuhkan bantuan

dibandingkan dengan kabupaten yang ada pada klaster kedua.

c. Uji Variance Klaster K-median

Berdasarkan persamaan (3.7), (3.8), dan (3.9) didapat hasil sebagai

berikut :

Tabel 4.10. Variansi setiap variabel

Variabel X1 611.518.110,1 528.972.334,1 1,156049326 X2 7.421.645.859 2.229.769.775 3,328435941

X3 646.402.449,2 1.376.121.469 0,469727756

X4 2.326.885.700 1.100.203.573 2,114959228

X5 3.013.667.582 1.011.294.993 2,980008408

X6 4.614.265.706 1.498.189.586 3,079894393

X7 10.353.109.573 3.063.649.882 3,379338361

Berdasarkan Tabel 4.10 terlihat bahwa nilai

.ଶ terbesar terdapat pada variabel X7 yaitu sebesar 3,379338361ߪ

Sehingga variabel jumlah penerima raskin adalah variabel yang memiliki

perbedaan paling berarti pada klaster 1, dan klaster 2 serta merupakan

variabel yang paling berpengaruh terhadap pembentukan klaster.

33

4.5 Analisis Diskriminan

Untuk mengetahui hasil pengklasteran mana yang lebih baik antara

metode klaster k-means dan k-median dilakukan analisis diskriminan

dengan langkah-langkah sebagai berikut :

a. Pengujian Asumsi Normal Multivariate

Sebelum melakukan analisis diskriminan terlebih dahulu melakukan

pengujian asumsi normal multivariate. Hasil pengujian asumsi normal

multivariate adalah sebagai berikut :

C26

C28

300250200150100500

0,12

0,10

0,08

0,06

0,04

0,02

0,00

Scatterplot of khi-kuadrat vs jarak mahalanobis (iterasi 1)

Gambar 4.1. Scatter plot khi-kuadrat dengan jarak Mahalonobis

Berdasarkan grafik tersebut, terlihat bahwa terdapat satu nilai yang

dideteksi sebagai outlier yaitu data ke 471, maka data tersebut dihilangkan

dari pengamatan.

34

Pada iterasi kedua, setelah menghilangkan data ke 471, didapat hasil

sebagai berikut :

C30

C31

100806040200

0,025

0,020

0,015

0,010

0,005

0,000

Scatterplot khi-kuadrat vs jarak mahalanobis (iterasi 2)

Gambar 4.2. Scatter plot khi-kuadrat dengan jarak Mahalonobis

Pada grafik tersebut terlihat bahwa data berkumpul pada suatu garis.

Sehingga dapat dikatakan asumsi normal multivariate sudah terpenuhi.

b. Menghitung ketepatan klasifikasi

1. K-means

Tabel 4.11. Ketepatan klasifikasi k-means


Aktual 1 390 4 394 2 3 73 76

Berdasarkan persamaan 3.10 maka didapat persentase ketepatan

klasifikasi klaster k-means sebagai berikut :

CCR = ଷଽାଷସ

x 100 % = 98,51 %

35

Berdasarkan persamaan 3.11 persentase kesalahan dalam

pengklasifikasian adalah sebagai berikut :

APER = ସାଷସ

x 100 % = 1,49 %

Berdasarkan perhitungan tersebut dapat terlihat bahwa nilai

ketepatan klasifikasi k-means sangat tinggi dengan tingkat kesalahan

sebesar 1,49%.

2. K-median

Tabel 4.12. Ketepatan klasifikasi k-median


Aktual 1 89 10 99 2 0 371 371

Berdasarkan persamaan 3.10 maka didapat persentase ketepatan

klasifikasi klaster k-median adalah sebagai berikut :

CCR = ଼ଽ ାଷଵ ସ

x 100 % = 97,87%

Berdasarkan persamaan 3.11 persentase kesalahan dalam

pengklasifikasian adalah sebagai berikut :

APER = ଵାସ

x 100 % = 2,13 %

36

Berdasarkan perhitungan tersebut dapat terlihat bahwa nilai

ketepatan klasifikasi k-median sangat tinggi dengan tingkat kesalahan

sebesar 2,13%.

Berdasarkan tingkat ketepatan klasifikasi terlihat bahwa nilai

ketepatan klasifikasi k-means (98,51 %) lebih baik dibandingkan k-median

(97,87%).

37

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Pada metode klaster k-means nilai ketepatan klasifikasi adalah

sebesar 98,51% sedangkan pada metode klaster k- median nilai ketepatan

klasifikasi sebesar 97,87%. Selain itu pada uji variance terlihat bahwa pada

beberapa variabel yaitu jumlah pekerja di bidang informal, jumlah rumah

tangga dengan luas lantai lebih dari 8 m2, jumlah rumah tangga

menggunakan air bersih, jumlah rumah tangga menggunakan jamban sendiri

dan jumlah rumah tangga penerima raskin nilai

-ଶ pada pengelompokkan k-means lebih besar dibandingkan dengan kߪ

median. Sehingga disimpulkan bahwa pada kasus ini metode

pengelompokkan k- means lebih baik dibandingkan dengan metode

pengelompokkan k-median.

Berdasarkan hasil penelitian pada metode k-means terdapat 2 klaster

yaitu :

Klaster 1 : kabupaten pekerja informal dengan fasilitas rumah tangga

cukup memadai.


kurang memadai.

38

Sedangkan pada metode k-median terdapat 2 klaster yaitu :


kurang memadai.


cukup memadai.

Berdasarkan hasil pengklasteran dengan metode k-means dapat

dikatakan bahwa kabupaten yang ada pada klaster kedua lebih

membutuhkan bantuan dibandingkan dengan kabupaten yang ada pada

klaster pertama. Sedangkan pada metode k-median dapat dikatakan bahwa

kabupaten yang ada pada klaster pertama lebih membutuhkan bantuan

dibandingkan dengan kabupaten yang ada pada klaster kedua.

5.2 Saran

Selain menggunakan metode k-means dan k-median,

pengelompokkan data juga dapat menggunakan metode klaster k-error.

Penelitian selanjutnya disarankan untuk menambahkan indikator

kemiskinan lainnya untuk hasil pengelompokkan yang lebih baik dan

membandingkan metode k-means dan k-error.

39

DAFTAR PUSTAKA

[1] Agusta, Yudi. K-Means - Penerapan Permasalahan dan Metode Terkait.

Bali : STMIK STIKOM Bali. 2007.

[2] Badan Pusat Statistik. Data dan Informasi Kemiskinan 2009, Buku 2:

Kabupaten/Kota. Jakarta: BPS. 2009.

[3] Budiono, Agung. Analisis komponen utama dan analisis gerombol untuk

pengelompokkan propinsi di Indonesia berdasar peubah industri kecil.

[Skripsi]. Bogor : Jurusan Statistika Fakultas MIPA IPB. 1987.

[4] Durran BS, Odell PL. Cluster Analysis. New York : Springer-Verlay.

Berlin. 1974.

[5] Flowrensia, Yanne. Perbandingan Penggerombolan K-means dan K-

medoid Pada Data Yang Mengandung Pencilan. [Skripsi]. Bogor : Jurusan

Statistika Fakultas MIPA IPB. 2010.

[6] Jhonson, Richard A. Dan Dean W Wichern. Applied multivariate

statistical anlysis. Edisi keempat. New York: Prentice-Hall International,

inc. 1998.

[7] Kaufma L and Peter JR. Findings Group in Data, An Introduction to

Cluster Analysis. New York : Jhon Willey and Sons Inc. 1990.

[8] Kumar, Mahesh dan Nithin R Patel. Clustering data with measurement

Error. New Jersey : Rutcor Research Report of rutgers University. 2005.

40

[9] Ruswandi, Bambang. Diktat Perkuliahan Praktikum Statistika Multivariat.

Jakarta : Program Studi Matematika Fakultas Sains dan Teknologi UIN

Jakarta. 2008.

[10] Setyoko, Mahmud. Uji Asumsi Klasik Statistik Pengaruh Kewenangan,

Kemitraan dan Konflik Terhadap Efektivitas Saluran Distribusi Minyak

Tanah Menggunakan SPSS Versi 13. Semarang : Politeknik Negeri

Semarang. 2008.

[11] Sharma, S. Applied Multivariate Techniques. Jhon Willey & Sons : New

York. 1996.

[12] Sidabutar, Drs. Albert. 14 indikator kemiskinan di rumah tangga, berhak

menerima bantuan langsung tunai.

http://barsamatoba.com/tobasa/berita/14-indikator-kemiskinan-di-rumah-

tangga-berhak-menerima-bntuan-langsung-tunai.html. [24 Februari 2011].

[13] Supranto, Johanes. Analisis Multivariat Arti dan Interpretasi. Rineka Cipta

: Jakarta. 2004.

41

LAMPIRAN

Lampiran 1. Hasil Pengklasteran

kabupaten Kode k-means k-median

Simeuleu 101 1 2 Aceh Singkil 102 1 2 Aceh Selatan 103 1 2 Aceh Tenggara 104 1 2 Aceh Timur 105 1 2 Aceh Tengah 106 1 2 Aceh Barat 107 1 2 Aceh Besar 108 1 2 Pidie 109 1 2 Bireuen 110 1 2 aceh Utara 111 2 1 Aceh Barat Daya 112 1 2 Gayo Lues 113 1 2 Aceh Tamiang 114 1 2 Nagan Raya 115 1 2 Aceh Jaya 116 1 2 Bener Meriah 117 1 2 Pidie Jaya 118 1 2 Banda Aceh 119 1 2 Sabang 120 1 2 Langsa 121 1 2 Lhoukseumawe 122 1 2 Subulussalam 123 1 2 Nias 201 1 1 Mandailing Natal 202 1 2 Tapanuli Selatan 203 1 2 Tapanuli Tengah 204 1 2 Tapanuli Utara 205 1 2 Toba Samosir 206 1 2 Labuhan Batu 204 1 2 Asahan 208 1 2 Simalungun 209 1 2 Dairi 210 1 2 Karo 211 1 2

42

Kabupaten Kode K-means K-median Deli Serdang 212 1 2 Langkat 213 1 1 Nias Selatan 214 1 2 Humbang Hasundutan 215 1 2 Pakpak Bharat 216 1 2 Samosir 217 1 2 Serdang Bedagai 218 1 2 Batu Bara 219 1 2 Padang Lawas Utara 220 1 2 Padang Lawas 221 1 2 Sibolga 222 1 2 Tanjung Balai 223 1 2 Pematang Siantar 224 1 2 Tebing Tinggi 225 1 2 Medan 226 2 1 Binjai 227 1 2 Padang Sidempuan 228 1 2 Kep. Mentawai 301 1 2 Pesisir Selatan 302 1 2 Solok 303 1 2 Sijunjung 304 1 2 Tanah Datar 305 1 2 Padang Pariaman 306 1 2 Agam 307 1 2 Lima Puluh Koto 308 1 2 Pasaman 309 1 2 Solok Selatan 310 1 2 Dharmasraya 311 1 2 Pasaman Barat 312 1 2 Padang 313 1 2 Solok 314 1 2 Sawahlunto 315 1 2 Padang Panjang 316 1 2 Bukit Tinggi 317 1 2 Payakumbuh 318 1 2 Pariaman 319 1 2 Kuantan Senggigi 401 1 2 Indragiri Hulu 402 1 2

43

Kabupaten Kode K-means K-median Indragiri Hilir 403 1 2 Pelalawan 404 1 2 Siak 405 1 2 Kampar 406 1 2 Rokan Hulu 407 1 2 Bengkalis 408 1 2 Rokan Hilir 409 1 2 Pekan Baru 410 1 2 Dumai 411 1 2 Kerinci 501 1 2 Merangin 502 1 2 Sarolangun 503 1 2 Batang Hari 504 1 2 Muaro Jambi 505 1 2 Tjg Jabung Timur 506 1 2 Tjg Jabung Barat 507 1 2 Tebo 508 1 2 Bungo 509 1 2 Jambi 510 1 2 Ogan Komering Ulu 601 1 2 Ogan Komering Ilir 602 1 1 Muara Enim 603 1 2 Lahat 604 1 2 Musi Rawas 605 1 2 Musi Banyuasin 606 1 1 Banyuasin 607 1 1 OKU Selatan 608 1 2 OKU Timur 609 1 2 Ogan Ilir 610 1 2 Empat Lawang 611 1 2 Palembang 612 2 1 Prabumulih 613 1 2 Pagar Alam 614 1 2 Lubuk Linggau 615 1 2 Bengkulu Selatan 701 1 2 Rejang Lebong 702 1 2 Bengkulu Utara 703 1 2 Kaur 704 1 2

44

Kabupaten Kode K-means K-median Seluma 705 1 2 Muko Muko 706 1 2 Lebong 707 1 2 Kepahiang 708 1 2 Bengkulu 709 1 2 Lampung Barat 801 1 2 Tanggamus 802 2 1 Lampung Selatan 803 2 1 Lampung Timur 804 2 1 Lampung Tengah 805 2 1 Lampung Utara 806 2 1 Way Kanan 807 1 2 Tulang Bawang 808 1 2 Pesawaran 809 1 2 Bandar Lampung 810 1 1 Metro 811 1 2 Bangka 901 1 2 Belitung 902 1 2 Bangka Barat 903 1 2 Bangka Tengah 904 1 2 Bangka Selatan 905 1 2 Bangka Timur 906 1 2 Pangkal Pinang 907 1 2 Karimun 1001 1 2 Bintan 1002 1 2 Natuna 1003 1 2 Lingga 1004 1 2 Batam 1005 1 2 Tanjung Pinang 1006 1 2 Kep. Seribu 1101 1 2 Jakarta Selatan 1102 1 2 Jakarta Timur 1103 1 2 Jakarta Pusat 1104 1 2 Jakarta Barat 1105 1 2 Jakarta Utara 1106 1 2 Bogor 1201 2 1 Sukabumi 1202 2 1 Cianjur 1203 2 1

45

Kabupaten Kode K-means K-median Bandung 1204 2 1 Garut 1205 2 1 Tasikmalaya 1206 2 1 Ciamis 1207 2 1 Kuningan 1208 2 1 Cirebon 1209 2 1 Majalengka 1210 2 1 Sumedang 1211 2 1 Indramayu 1212 2 1 Subang 1213 2 1 Purwakarta 1214 1 2 Karawang 1215 2 1 Bekasi 1216 1 1 Bandung Barat 1217 2 1 Kota Bogor 1218 1 2 Kota Sukabumi 1219 1 2 Kota Bandung 1220 1 1 Kota Cirebon 1221 1 2 Kota Bekasi 1222 1 1 Kota Depok 1223 1 2 Kota Cimahi 1224 1 2 Kota Tasikmalaya 1225 2 1 Kota Banjar 1226 1 2 Cilacap 1301 2 1 Banyumas 1302 2 1 Purbalingga 1303 2 1 Banjarnegara 1304 2 1 Kebumen 1305 2 1 Purworejo 1306 1 1 Wonosobo 1307 2 1 Magelang 1308 2 1 Boyolali 1309 2 1 Klaten 1310 2 1 Sukoharjo 1311 1 2 Wonogiri 1312 2 1 Karang Anyar 1313 2 1 Sragen 1314 2 1 Grobogan 1315 2 1

46

Kabupaten Kode K-means K-median Blora 1316 2 1 Rembang 1317 2 1 Pati 1318 2 1 Kudus 1319 1 2 Jepara 1320 1 1 Demak 1321 2 1 Semarang 1322 1 1 Temanggung 1323 1 1 Kendal 1324 2 1 Batang 1325 1 1 Pekalongan 1326 2 1 Pemalang 1327 2 1 Tegal 1328 2 1 Brebes 1329 2 1 Kota Magelang 1330 1 2 Kota Surakarta 1331 1 2 Kota Salatiga 1332 1 2 Kota Semarang 1333 1 2 Kota Pekalongan 1334 1 2 Kota Tegal 1335 1 2 Kulon Progo 1401 1 2 Bantul 1402 2 1 Gunung Kidul 1403 2 1 Sleman 1404 1 1 Kota Yogyakarta 1405 1 2 Pacitan 1501 1 1 Ponorogo 1502 2 1 Trenggalek 1503 2 1 Tulungagung 1504 1 1 Blitar 1505 2 1 Kediri 1506 2 1 Malang 1507 2 1 Lumajang 1508 2 1 Jember 1509 2 1 Banyuwangi 1510 2 1 Bondowoso 1511 2 1 Situbondo 1512 1 2 Probolinggo 1513 2 1

47

Kabupaten Kode K-means K-median Pasuruan 1514 2 1 Sidoarjo 1515 1 1 Mojokerto 1516 1 1 Jombang 1517 2 1 Nganjuk 1518 2 1 Madiun 1519 1 1 Magetan 1520 1 2 Ngawi 1521 2 1 Bojonegoro 1522 2 1 Tuban 1523 2 1 Lamongan 1524 2 1 Gresik 1525 2 1 Bangkalan 1526 2 1 Sampang 1527 2 1 Pamekasan 1528 2 1 Sumenep 1529 2 1 Kota Kediri 1530 1 2 Kota Blitar 1531 1 2 Kota Malang 1532 1 2 Kota Probolinggo 1533 1 2 Kota Pasuruan 1534 1 2 Kota Mojokerto 1535 1 2 Kota Madiun 1536 1 2 Kota Surabaya 1537 2 1 Kota Batu 1538 1 2 Pandeglang 1601 1 2 Lebak 1602 1 1 Tangerang 1603 2 1 Serang 1604 1 2 Kota Tangerang 1605 1 2 Kota Cilegon 1606 1 2 Kota Serang 1607 1 2 Jembrana 1701 1 2 Tabanan 1702 1 2 Badung 1703 1 2 Gianyar 1704 1 2 Klungkung 1705 1 2 Bangli 1706 1 2

48

Kabupaten Kode K-means K-median Karangasem 1707 1 2 Buleleng 1708 1 2 Kota Denpasar 1709 1 2 Lombok Barat 1801 2 1 Lombok Tengah 1802 2 1 Lombok Timur 1803 2 1 Sumbawa 1804 1 1 Dompu 1805 1 2 Bima 1806 1 2 Sumbawa Barat 1807 1 2 Kota Mataram 1808 1 2 Kota Bima 1809 1 2 Sumba Barat 1901 1 2 Sumba Timur 1902 1 2 Kupang 1903 1 1 Timor Tengah Selatan 1904 2 1 Timor Tengah Utara 1905 1 2 Belu 1906 1 2 Alor 1907 1 2 Lembata 1908 1 2 Flores Timur 1909 1 2 Sikka 1910 1 2 Ende 1911 1 2 Ngada 1912 1 2 Manggarai 1913 1 2 Rote Ndao 1914 1 2 Manggarai Barat 1915 1 2 Sumba Barat Daya 1916 1 2 Sumba Tengah 1917 1 2 Nagekeo 1918 1 2 Manggarai Timur 1919 1 2 Kota Kupang 1920 1 2 Sambas 2001 1 2 Bengkayang 2002 1 2 Landak 2003 1 2 Pontianak 2004 1 2 Sanggau 2005 1 2 Ketapang 2006 1 2

49

Kabupaten Kode K-means K-median Sintang 2007 1 2 Kapuas Hulu 2008 1 2 Sekadau 2009 1 2 Melawi 2010 1 2 Kayong Utara 2011 1 2 Kubu Raya 2012 1 2 Kota Pontianak 2013 1 2 Kota Singkawa 2014 1 2 Kotawaringin Barat 2101 1 2 Kotawaringin Timur 2102 1 2 Kapuas 2103 1 2 Barito Selatan 2104 1 2 Barito Utara 2105 1 2 Sukamara 2106 1 2 Lamandau 2107 1 2 Seruyan 2108 1 2 Katingan 2109 1 2 Pulang Pisau 2110 1 2 Gunung Mas 2111 1 2 Barito Timur 2112 1 2 Murung Raya 2113 1 2 Kota Palangka Raya 2114 1 2 Tanah Laut 2201 1 2 Kota Baru 2202 1 2 Banjar 2203 1 2 Barito Kuala 2204 1 2 Tapin 2205 1 2 Hulu Sungai Selatan 2206 1 2 Hulu Sungai Tengah 2207 1 2 Hulu Sungai Utara 2208 1 2 Tabalong 2209 1 2 Tanah Bumbu 2210 1 2 Balanga 2211 1 2 Banjarmasin 2212 1 2 Banjar Baru 2213 1 2 Pasir 2301 1 2 Kutai Barat 2302 1 2 Kutai 2303 1 2

50

Kabupaten Kode K-means K-median Kutai Timur 2304 1 2 Berau 2305 1 2 Malinau 2306 1 2 Bulungan 2307 1 2 Nunukan 2308 1 2 Penajam Paser Utara 2309 1 2 Tana Tidung 2310 1 2 Kota Balikpapan 2311 1 2 Kota Samarinda 2312 1 2 Kota Tarakan 2313 1 2 Kota Bontang 2314 1 2 Bolaang Mongondow 2401 1 2 Minahasa 2402 1 2 Kep. Sangihe Talaud 2403 1 2 Kep. Talaud 2404 1 2 Minahasa Selatan 2405 1 2 Minahasa Utara 2406 1 2 Bolaang Mongondow Utara 2407 1 2 Kep. Sitaro 2408 1 2 Minahasa Tenggara 2409 1 2 Kota Manado 2410 1 2 Kota Bitung 2411 1 2 Kota Tomohon 2412 1 2 Kota Kotamobagu 2413 1 2 Banggai Kepulauan 2501 1 2 Banggai 2502 1 2 Morowali 2503 1 2 Poso 2504 1 2 Donggala 2505 1 2 Toli Toli 2506 1 2 Buol 2507 1 2 Parigi Moutong 2508 1 2 Tojo Una-Una 2509 1 2 Kota Palu 2510 1 2 Selayar 2601 1 2 Bulukumba 2602 1 2 Bantaeng 2603 1 2

51

Kabupaten Kode K-means K-median Jeneponto 2604 1 2 Takalar 2605 1 2 Gowa 2606 1 2 Sinjai 2607 1 2 Maros 2608 1 2 Pangkajene Kepulauan 2609 1 2 Barru 2610 1 2 Bone 2611 1 2 Soppeng 2612 1 2 Wajo 2613 1 2 Sidenreng Rappang 2614 1 2 Pinrang 2615 1 2 Enrekang 2616 1 2 Luwu 2617 1 2 Tana Toraja 2618 1 2 Luwu Utara 2619 1 2 Luwu Timur 2620 1 2 Kota Makassar 2621 1 2 Kota Pare Pare 2622 1 2 Kota Palopo 2623 1 2 Buton 2701 1 2 Muna 2702 1 2 Kendari 2703 1 2 Kolaka 2704 1 2 Konawe Selatan 2705 1 2 Bombana 2706 1 2 Wakatobi 2707 1 2 Kolaka Utara 2708 1 2 Buton 2709 1 2 Konawe Utara 2710 1 2 Kota Kendari 2711 1 2 Kota Baubau 2712 1 2 Boalemo 2801 1 2 Gorontalo 2802 1 2 Pohuwato 2803 1 2 Bone Bolange 2804 1 2 Gorontalo Utara 2805 1 2 Kota Gorontalo 2806 1 2

52

Kabupaten Kode K-means K-median Majene 2901 1 2 Polewali Mamasa 2902 1 2 Mamasa 2903 1 2 Mamuju 2904 1 2 Mamuju Utara 2905 1 2 Maluku Tenggara Barat 3001 1 2 Maluku Tenggara 3002 1 2 Maluku Tengah 3003 1 2 Buru 3004 1 2 Kepulauan Aru 3005 1 2 Seram Bagian Barat 3006 1 2 Seram Bagian Timur 3007 1 2 Kota Ambon 3008 1 2 Kota Tual 3009 1 2 Halmahera Barat 3101 1 2 Halmahera Tengah 3102 1 2 Kepulauan Sula 3103 1 2 Halmahera Selatan 3104 1 2 Halmahera Utara 3105 1 2 Halmahera Timur 3106 1 2 Kota Ternate 3107 1 2 Kota Tidore Kepulauan 3108 1 2 Fakfak 3201 1 2 Kaimana 3202 1 2 Teluk Wondama 3203 1 2 Teluk Bintuni 3204 1 2 Manokwari 3205 1 2 Sorong Selatan 3206 1 2 Sorong 3207 1 2 Raja Ampat 3208 1 2 Kota Sorong 3209 1 2 Merauke 3301 1 2 Jayawijaya 3302 1 2 Jayapura 3303 1 2 Nabire 3304 1 2 Yapin Waropen 3305 1 2 Biak Numfor 3306 1 2 Paniai 3307 1 2

53

Kabupaten Kode K-means K-median Puncak Jaya 3308 1 2 Mimika 3309 1 2 Boven Digoel 3310 1 2 Mappi 3311 1 2 Asmat 3312 1 2 Yahukimo 3313 1 2 Pegunungan Bintang 3314 1 2 Tolikara 3315 1 2 Sarmi 3316 1 2 Keerom 3317 1 2 Waropen 3318 1 2 Supiori 3319 1 2 Mamberamo Raya 3320 1 2 Nduga 3321 1 2 Lanny Jaya 3322 1 2 Mamberamo Tengah 3323 1 2 Yalimo 3324 1 2 Puncak 3325 1 2 Dogiyai 3326 1 2 Jayapura 3327 1 2

54

Lampiran 2. Output Nilai Variance Inflation Factor (VIF)

Lampiran 3. Perhitungan Nilai ߪଶ pada k-means.

55

Lampiran 4. Perhitungan nilai ߪଶ pada k-median.

56

Lampiran 5. Ketepatan klasifikasi K-means.

Classification Resultsb,c

k_means

Predicted Group Membership

Total 1 2

Original Count 1 390 4 394

2 3 73 76

% 1 99.0 1.0 100.0

2 3.9 96.1 100.0

Cross-validateda Count 1 390 4 394

2 3 73 76

% 1 99.0 1.0 100.0

2 3.9 96.1 100.0

a. Cross validation is done only for those cases in the analysis. In cross validation,

each case is classified by the functions derived from all cases other than that case.

b. 98,5% of original grouped cases correctly classified.

c. 98,5% of cross-validated grouped cases correctly classified.

57

Lampiran 6. Ketepatan klasifikasi k-median.

Classification Resultsb,c

k_medi

an

Predicted Group Membership

Total 1 2

Original Count 1 89 10 99

2 0 371 371

% 1 89.9 10.1 100.0

2 .0 100.0 100.0

Cross-validateda Count 1 87 12 99

2 0 371 371

% 1 87.9 12.1 100.0

2 .0 100.0 100.0

a. Cross validation is done only for those cases in the analysis. In cross validation,

each case is classified by the functions derived from all cases other than that case.

b. 97,9% of original grouped cases correctly classified.

c. 97,4% of cross-validated grouped cases correctly classified.

Lampiran 7. Perhitungan Rata-rata setiap Variabel pada klaster k-means.

Lampiran 8. Perhitungan Rata-rata setiap Variabel pada klaster k-median.

Nama : Febriyana

NIM : 107094002893

Tempat Tanggal Lahir : Pandeglang, 5 Februari 1989

Alamat Rumah : Jalan Raya Labuan Km 6

Kp. Kadukanas Rt 01 Rw 01

Desa Sukasari Kec. Kaduhejo

Kab. Pandeglang - Banten

Phone / Hand Phone : 08998944001

Email : [email protected]

Jenis Kelamin : Laki-laki

1. S1 : Program Studi Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta, Tahun 2007 – 2011

2. SMA : SMAN 1 Pandeglang, Tahun 2004 – 2007 3. SMP : SMPN 1 Pandeglang, Tahun 2001 – 2004 4. SD : SDN 1 Pandeglang, Tahun 1995 – 2001

DAFTAR RIWAYAT HIDUP

Data Pribadi

Riwayat Pendidikan

ANALISIS KLASTER K-MEANS DAN K-MEDIAN PADA DATA … · 2013-05-27 · ANALISIS KLASTER K-MEANS DAN...

Documents

Transcript of ANALISIS KLASTER K-MEANS DAN K-MEDIAN PADA DATA … · 2013-05-27 · ANALISIS KLASTER K-MEANS DAN...