PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · banyak kekurangan. Untuk itu, penulis...
Transcript of PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · banyak kekurangan. Untuk itu, penulis...
IMPLEMENTASI ALGORITMA FUZZY C-MEANS UNTUK
PENGELOMPOKAN SEKOLAH MENENGAH ATAS
DI DIY BERDASARKAN NILAI UJIAN NASIONAL
DAN NILAI SEKOLAH
SKRIPSI
Diajukan Untuk Memenuhi salah Satu Syarat
Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika
Disusun Oleh :
Maria Riana Megawati
115314058
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2015
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
THE IMPLEMENTATION OF FUZZY C-MEANS ALGORITHM FOR
CLUSTERING SENIOR HIGH SCHOOL BASED ON THE VALUE OF
NATIONAL EXAM AND VALUE OF SCHOOL
A THESIS
Presented as Partial Fulfillment of the Requirements
To Obtain the Sarjana Komputer Degree
In Departement of Informatic Engineering
By :
Maria Riana Megawati
115314058
INFORMATICS ENGINEERING STUDY
PROGRAM DEPARTMENT OF INFORMATICS
ENGINEERING FACULTY OF SCIENCE AND
TECHNOLOGY SANATA DHARMA UNIVERSITY
YOGYAKARTA
2015
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
HALAMAN PERSETUJUAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
HALAMAN PENGESAHAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
HALAMAN PERSEMBAHAN
“Success does not suddenly come to you. You have to go out and work hard to get it”
“Time is like a river. You cannot touch the same water twice, because the flow that has passed will never pass again.
Enjoy every moment of life…”
”When you keep saying you are busy, then you are never free. When you keep saying you have no time, then you will never have time.
When you keep saying that you will do it tomorrow, then your tomorrow will never come”
“Intelligence is not the determinant of success, but hard work is the real determinant of your success.”
“Do n’t be afraid to move, because the distance of 1000 miles starts by a single step.”
“Aku ini adalah hamba Tuhan; terjadilah padaku menurut perkataan-Mu”
(Luk 1:38)
Skripsi ini , penulis persembahkan untuk :
Kedua orangtua ku
Terimakasih atas semua doa, kasih saying, dukungan ,
kepercayaan, dan bantuannya selama ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi saya yang saya tulis ini
tidak memuat karya atau bagian karya orang lain, kecuali yang telah saya sebutkan
dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta , 31 Agustus 2015
Penulis,
Maria Riana Megawati
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :
Nama : Maria Riana Megawati
Nomor Mahasiswa : 115314058
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma karya ilmiah saya yang berjudul :
“IMPLEMENTASI ALGORITMA FUZZY C-MEANS UNTUK
PENGELOMPOKAN SEKOLAH MENENGAH ATAS DI DIY BERDASARKAN
NILAI UJIAN NASIONAL DAN NILAI SEKOLAH“
beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan
kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, me-
ngalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,
mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media
lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun
memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai
penulis.
Demikian pernyataan ini yang saya buat dengan sebenarnya.
Dibuat di Yogyakarta
Pada tanggal : 31 Agustus 2015
Yang menyatakan,
(Maria Riana Megawati)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRAK
Data mining merupakan penambangan atau penemuan informasi baru dengan
mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar . Salah satu
metode data mining yaitu clustering. Clustering adalah proses mengelompokkan
objek ke dalam suatu kelompok (cluster) sehingga objek memiliki kemiripan sangat
besar dengan objek lain yang berada pada cluster yang sama, tetapi memiliki
ketidakmiripan yang besar dengan objek yang berada pada cluster berbeda. Salah
satu algoritma clustering adalah Fuzzy C-Means (FCM). FCM adalah metode
clustering fuzzy dimana keberadaan tiap titik data dalam suatu cluster ditentukan oleh
derajat keanggotaan. Dengan metode ini, data akan dikelompokkan ke dalam cluster
yang berbeda sesuai persentase keanggotaannya di masing-masing klaster.
Pada tugas akhir ini akan diimplementasikan algoritma Fuzzy C-Means untuk
mengelompokkan data Sekolah Menengah Atas di DIY berdasarkan nilai Ujian
Nasional dan Nilai Sekolah. Hasil tugas akhir ini yaitu sebuah perangkat lunak yang
dapat digunakan sebagai alat bantu untuk pengelompokan Sekolah Menengah Atas
menggunakan algoritma Fuzzy C-Means . Pengujian terhadap sistem ini terdiri dari
pengujian blackbox, dan pengujian validitas implementasi algoritma Fuzzy C-Means.
Berdasarkan hasil pengujian blackbox yang dilakukan, disimpulkan bahwa
sistem pengelompokan ini dapat menghasilkan keluaran yang sesuai dengan yang
diharapkan pengguna. Berdasarkan hasil pengujian validitas implementasi algoritma
Fuzzy C-Means. yang dilakukan, disimpulkan bahwa Metode clustering algoritma
Fuzzy C-Means terbukti dapat mengelompokkan sekumpulan data bertipe numerik.
Kata kunci: Data mining, algoritma Fuzzy C-Means, Clustering.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
ABSTRACT
Data mining is mining procces or extracting information by getting pattern or
specific rules from large amounts of data . One of the data mining method is
clustering. Clustering is the process of grouping objects into a group (cluster) so that
the object has a very great similarity with other objects that are on the same cluster,
but has a great dissimilarity with objects that are in different clusters. One algorithm
of clustering is Fuzzy C-Means (FCM). FCM is a technique of fuzzy clustering in
which each data point in a cluster is determined by the degree of membership. With
this method, the data will be grouped into different clusters according to percentage
of membership in each cluster.
This thesis will implement Fuzzy C-Means algorithm was used to clustering
high school data based on the value of National Exam and School Exam. The results
of this thesis is a software that can be used as a tool to cluster high school data using
Fuzzy C-Means algorithm. The testing of this system consists of blackbox testing
and validity testing of Fuzzy C-Means algorithm implementation.
Based on blackbox testing, it can be concluded that the clustering system
could produce output as expected and handle any incorrect functions. Based on
validity testing of Fuzzy C-Means algorithm implementation, it can be concluded
that the clustering method Fuzzy C-Means algorithm, is able to classify the type of
numerical data set
Keywords : Data mining, Fuzzy C-Means algorithm, Clustering.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
KATA PENGANTAR
Puji syukur kepada Tuhan Yesus Kristus, atas segala berkat dan karunia
sehingga penulis dapat menyelesaikan tugas akhir yang berjudul “Implementasi
Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Atas di
DIY Berdasarkan Nilai Ujian Nasional dan Nilai Sekolah”. Tugas akhir ini ditulis
sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik
Informatika, Falkutas Sains dan Teknologi Sanata Dharma.
Penulisan tugas akhir ini berjalan dengan baik dari awal hingga akhir karena
adanya dukungan doa, semangat dan motivasi yang diberikan oleh banyak pihak.
Untuk itu, penulis ingin mengucapkan terima kasih kepada:
1. Tuhan Yesus Kristus dan Bunda Maria yang selalu memberikan anugerah,
rahmat, kekuatan dan keberuntungan sehingga penulis dapat menyelesaikan
tugas akhir ini.
2. Kedua Orang Tua saya, Ir. Agustinus Sumasriyana M.Si dan Fransiska Wiwik
Suryani S.Pd atas doa, kasih sayang, perhatian,kepercayaaan, dukungan baik
moral maupun financial yang diberikan kepadaku.
3. Kakak ku tersayang, Catharina Andrian Shinta Dewi, dan saudara-saudarku
tersayang, Lintang Sari P, serta Sukma yang menemani dalam penyusunan
tugas akhir.
4. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc. selaku Dekan Fakultas
Sains dan Teknologi Universitas Sanata Dharma Yogyakarta sekaligus Dosen
Pembimbing yang telah dengan sabar membimbing dan memberikan
motivasi.
5. Ibu Dr. Anastasia Rita Widiarti selaku Ketua Program Studi Teknik
Informatika Falkutas Sains dan Teknologi Universitas Sanata Dharma
Yogyakarta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
6. Bapak Puspaningtyas Sanjoyo Adi, S.T.,M.T. selaku Dosen Pembimbing
Akademik .
7. Ibu Agnes Maria Polina, S.Kom,M.Sc, dan Bapak Robertus Adi Nugroho,
S.T., M.Eng selaku Dosen Penguji, atas kritik dan saran yang telah diberikan.
8. Seluruh Dosen jurusan Teknik Informatika Universitas Sanata Dharma, yang
telah mengajarkan banyak ilmu kepada penulis.
9. Para sahabat Fany, Evi , terimakasih atas doa, dan dukungan kalian bagi
penulis.
10. Untuk Meity, Lia, Kezia, Monic, terima kasih atas dukungan dan bantuannya
selama ini bagi penulis.
11. Seluruh teman-teman TI angkatan 2011 untuk kebersamaan kita selama
menjalani masa perkuliahan ini.
12. Serta semua pihak yang telah membantu penyusunan skripsi yang tidak dapat
disebutkan satu, persatu.
Penulisan menyadari bahwa penulisan laporan tugas akhir ini masih memiliki
banyak kekurangan. Untuk itu, penulis sangat membutuhkan saran dan kritik
untuk perbaikan di masa yang akan datang. Semoga penulisan laporan tugas
akhir ini dapat berguna dan bermanfaat bagi semua pihak.
Yogyakarta , 31 Agustus 2015
Penulis
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
DAFTAR ISI
HALAMAN JUDUL ..................................................................................................... i
HALAMAN JUDUL (BAHASA INGGRIS) ............................................................... ii
HALAMAN PERSETUJUAN ..................................................................................... iii
HALAMAN PENGESAHAN ..................................................................................... iv
HALAMAN PERSEMBAHAN .................................................................................. iv
PERNYATAAN KEASLIAN KARYA ...................................................................... vi
LEMBAR PERNYATAAN PERSETUJUAN ........................................................... vii
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ............... vii
ABSTRAK ................................................................................................................. viii
ABSTRACT ................................................................................................................. ix
KATA PENGANTAR .................................................................................................. x
DAFTAR ISI ............................................................................................................... xii
DAFTAR TABEL ...................................................................................................... xvi
DAFTAR GAMBAR ............................................................................................... xviii
BAB I ............................................................................................................................ 1
PENDAHULUAN ........................................................................................................ 1
1.1 LATAR BELAKANG ...................................................................................... 1
1.2 RUMUSAN MASALAH .................................................................................. 2
1.3 TUJUAN ........................................................................................................... 3
1.4 BATASAN MASALAH ................................................................................... 3
1.5 MANFAAT PENELITIAN ............................................................................... 3
1.6 METODOLOGI PENELITIAN ........................................................................ 4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
1.7 SISTEMATIKA PENULISAN ......................................................................... 5
BAB II ........................................................................................................................... 7
TINJAUAN PUSTAKA DAN DASAR TEORI .......................................................... 7
2.1 TINJAUAN PUSTAKA .................................................................................... 7
2.2 DASAR TEORI ................................................................................................ 8
2.2.1 Ujian Nasional (UN) dan Ujian Sekolah (US) .......................................... 8
2.2.1.1 Ujian Nasional (UN) ......................................................................... 8
2.2.1.2 Ujian Sekolah (US) ........................................................................... 9
2.2.1.3 Standar Kelulusan ............................................................................. 9
2.2.2 Knowledge Discovery in Database (KDD) ............................................. 11
2.2.3 Konsep Clustering .................................................................................. 13
2.2.4 Algoritma Fuzzy C-Means (FCM) .......................................................... 16
2.2.5 Contoh Penerapan Fuzzy C-Means (FCM) ............................................. 19
BAB III ....................................................................................................................... 24
ANALISIS DAN PERANCANGAN SISTEM .......................................................... 24
3.1 ANALISIS KEBUTUHAN ............................................................................. 24
3.1.1 Identifikasi sistem ................................................................................... 24
3.1.2 Use case Diagram ................................................................................... 25
3.1.3 Input Sistem ............................................................................................ 25
3.1.4 Proses Sistem .......................................................................................... 25
3.1.5 Output Sistem .......................................................................................... 27
3.1.6 Kebutuhan Perangkat Lunak ...................................................................... 28
3.1.7 Kebutuhan Perangkat Keras ....................................................................... 28
3.2 PERANCANGAN SISTEM ........................................................................... 28
3.2.1 Desain Proses Umum Sistem .................................................................. 28
3.2.2 Diagram Aktivitas (Activity diagram)..................................................... 31
3.2.3 Diagram Kelas (Class Diagram)............................................................. 31
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
3.2.4 Diagram Sekuen (Sequence Diagram) .................................................... 32
3.3 PERANCANGAN ANTAR MUKA ............................................................... 34
3.3.1 Halaman Awal ........................................................................................ 34
3.3.2 Halaman Praproses .................................................................................. 35
3.3.3 Halaman Distribusi Atribut ..................................................................... 35
3.3.4 Halaman Fuzzy C-Means ........................................................................ 36
3.3.5 Halaman Plot Klaster .............................................................................. 37
3.3.6 Halaman Bantuan .................................................................................... 38
BAB IV ....................................................................................................................... 39
IMPLEMENTASI DAN PENGUJIAN SISTEM ....................................................... 39
4.1 IMPLEMENTASI ANTAR MUKA ............................................................... 40
4.1.1 Implementasi Halaman Awal .................................................................. 40
4.1.2 Implementasi Halaman Praproses Data .................................................. 40
4.1.3 Implementasi Halaman Distribusi Atribut .............................................. 42
4.1.4 Implementasi Halaman Fuzzy C-Means ................................................. 43
4.1.5 Implementasi Halaman Plot Clustering .................................................. 45
4.1.6 Implementasi Halaman Bantuan ............................................................. 45
4.2 IMPLEMENTASI KELAS ............................................................................ 46
4.2.1 Implementasi Kelas MenuAwal .............................................................. 46
4.2.2 Implementasi Kelas PraprosesGUI ......................................................... 47
4.2.3 Implementasi Kelas Distribusi Atribut ................................................... 49
4.2.4 Implementasi Kelas Fuzzy C-Means ....................................................... 51
4.2.5 Implementasi Kelas ScatterAdd .............................................................. 55
4.2.6 Implementasi Kelas tProgram ................................................................. 56
4.3 PENGUJIAN SISTEM .................................................................................... 56
4.3.1 Pengujian Blackbox ................................................................................ 57
4.3.2 Pengujian Validitas Implementasi Algoritm FCM .................................. 58
4.3.2.1 Pengujian Algoritma FCM pada Sistem ......................................... 59
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
4.3.2.2 Pengujian Perbandingan Hasil Secara Manual dan Sistem ........... 61
4.3.2.3 Pengujian Perubahan Nilai Galat(e) dan Maksimal Iterasi(i) ........ 62
4.3.2.4 Pengujian Perbandingan Hasil Sistem dengan Matlab .................. 64
4.4 KELEBIHAN DAN KEKURANGAN SISTEM ............................................ 75
4.4.1 Kelebihan Sistem .................................................................................... 75
4.4.2 Kekurangan Sistem ................................................................................. 76
BAB V ........................................................................................................................ 77
KESIMPULAN DAN SARAN ................................................................................... 77
5.1 KESIMPULAN ............................................................................................... 77
5.2 SARAN ........................................................................................................... 77
DAFTAR PUSTAKA ................................................................................................. 78
LAMPIRAN ................................................................................................................ 79
LAMPIRAN TABEL RINGKASAN USECASE .................................................... 79
LAMPIRAN DIAGRAM AKTIFITAS (ACTIVITY DIAGRAM) ........................... 80
LAMPIRAN DIAGRAM KONTEKS .................................................................... 85
LAMPIRAN UJI PERUBAHAN NILAI GALAT(E), DAN MAKSIMAL ITERASI
(I) ............................................................................................................................. 86
LAMPIRAN DATA UJI MATLAB ........................................................................ 90
LAMPIRAN GAMBAR SCREENSHOT UJI MATLAB....................................... 91
LAMPIRAN GAMBAR SCREENSHOT HASIL UJI SISTEM ............................. 97
LAMPIRAN PERBANDINGAN DETAIL TABEL 4.14 ..................................... 104
LAMPIRAN UJI MANUAL ................................................................................. 108
LAMPIRAN UJI PEMBAHASAN ....................................................................... 118
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvi
DAFTAR TABEL
Tabel 2.1 Kunjungan Objek Wisata .......................................................................... 19
Tabel 2.2 Pembangkitan Matriks partisi Uik ............................................................. 20
Tabel 2.3 Perhitungan Pusat Cluster v1 .................................................................... 20
Tabel 2.4 Perhitungan Pusat Cluster v2 .................................................................... 20
Tabel 2.5 Perhitungan Pusat Cluster v3 .................................................................... 20
Tabel 4.1 Tabel nama kelas yang diimplementasikan .............................................. 39
Tabel 4.2 Tabel Hasil Pengujian Blackbox ............................................................... 57
Tabel 4.3 Tabel Data Uji Algoritma FCM ................................................................ 58
Tabel 4.4 Sampel Data Uji Secara Manual dan Sistem ............................................ 61
Tabel 4.5 Uji Perbandingan Algoritma FCM Secara Manual dan Sistem ................ 62
Tabel 4.6 Hasil uji perbandingan member percluster secara manual dan
sistem ....................................................................................................... 62
Tabel 4.7 Uji perubahan nilai Galat ( e) dan maksimal Iterasi (i) ............................. 63
Tabel 4.8 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............... 64
Tabel 4.9 Hasil uji perbandingan member percluster nilai ujian nasional, nilai
sekolah ...................................................................................................... 64
Tabel 4.10 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............. 68
Tabel 4.11 Hasil uji perbandingan member percluster nilai ujian .......................... 68
Tabel 4.12 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............. 71
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvii
Tabel 4.13 Hasil uji perbandingan member percluster nilai ujian sekolah .............. 71
Tabel 4.14 Hasil uji perbandingan hasil jumlah member percluster ....................... 75
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xviii
DAFTAR GAMBAR
Gambar 1.1 Metodologi Perangkat Lunak (Classic life Cycle/Waterfall) ................. 4
Gambar 2.1 Tahapan proses sebuah sistem KDD (Jiawei Han & Micheline
Kamber,2006) ........................................................................................ 12
Gambar 3.1 Use Case Diagram ................................................................................. 25
Gambar 3.2 Flowchart Algoritma Fuzzy C-Means .................................................... 27
Gambar 3.3 Proses buka dan cek berkas input .......................................................... 28
Gambar 3.4 Desain Proses Clustering Fuzzy C-Means pada aplikasi ....................... 30
Gambar 3.5 Diagram Kelas ........................................................................................ 32
Gambar 3.6 Diagram Sekuen Buka Berkas ............................................................... 32
Gambar 3.7 Diagram Sekuen Clustering ................................................................... 33
Gambar 3.8 Rancangan Halaman Awal ..................................................................... 34
Gambar 3.9 Rancangan Halaman Praproses ............................................................. 35
Gambar 3.10 Rancangan Halaman Distribusi Atribut ............................................... 36
Gambar 3.11 Rancangan Halaman Fuzzy C-Means................................................... 37
Gambar 3.12 Rancangan Halaman Plot Klaster......................................................... 37
Gambar 3.13 Halaman Bantuan ................................................................................. 38
Gambar 4.1 Antarmuka Halaman Awal .................................................................... 40
Gambar 4.2 Antarmuka Halaman Praposes Data...................................................... 41
Gambar 4.3 Antarmuka Halaman Praposes Data (Berkas .xls atau .csv) ................ 41
Gambar 4.4 Antarmuka Halaman Praposes Data (Hapus Atribut) ........................... 42
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xix
Gambar 4.5 Antarmuka Halaman Distribusi Atribut ................................................ 43
Gambar 4.6 Antarmuka Halaman Fuzzy C-Means ................................................... 43
Gambar 4.7 Antarmuka Halaman Fuzzy C-Means (Clustering) ............................... 44
Gambar 4.8 Antarmuka Halaman Plot Klaster ......................................................... 45
Gambar 4.9 Antarmuka Halaman Bantuan ............................................................... 46
Gambar 4.10 Pengujian Algoritma FCM pada Sistem ............................................. 59
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Penambangan data (Data mining) adalah kegiatan yang meliputi
pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau
hubungan dalam set data berukuran besar. Penambangan data dalam bidang
pendidikan, berfokus pada pengembangan metode-metode untuk mengekstrak
knowledge dari data-data pendidikan. Data pendidikan dapat berupa data pribadi
atau akademik. Penambangan data berkembang menjadi alat bantu untuk mencari
pola-pola yang berharga dalam suatu database yang sangat besar jumlahnya,
sehingga tidak memungkinkan dicari secara manual.
Clustering adalah salah satu teknik dari penambangan data. Teknik
penambangan data seperti clustering dapat digunakan untuk pengelompokan dan
analisis. Clustering adalah proses pengelompokan atau segmentasi sejumlah data
objek menjadi beberapa cluster yang mirip satu sama lain antar objeknya. Kondisi
kualitas cluster yang baik dimana pada saat cluster memiliki homogenitas internal
yang tinggi dan heterogenitas eksternal yang tinggi. Beberapa algoritma telah
dikembangkan untuk melakukan clustering. Salah satu algoritma untuk clustering
adalah Fuzzy C-Means (FCM).
Fuzzy C-Means (FCM), dikenal juga sebagai Fuzzy ISODATA. Fuzzy C-
Means merupakan salah satu algoritma dari cluster analysis , dimana keberadaan
tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat atau tingkat
keanggotaannya. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada
tahun 1981. Fuzzy C-Means menerapkan pengelompokan fuzzy dimana setiap data
memungkinkan menjadi bagian anggota dari beberapa cluster dengan
keanggotaan yang berbeda-beda untuk setiap cluster. Fuzzy C-Means memiliki
tujuan yaitu mendapatkan pusat cluster sehingga dapat digunakan untuk
mengetahui data yang ada di dalam sebuah cluster (Kusumadewi S, 2010).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
Kelebihan yang dimiliki oleh Fuzzy C-Means adalah clustering dapat dilakukan
lebih dari satu variabel secara bersamaan (Hadi HY,2005).
Algoritma Fuzzy C-Means (FCM) dapat diimplementasikan pada
sekumpulan data numerik dalam proses pengelompokan data. Salah satu contoh
data numerik yaitu data sekolah yang berupa data nilai ujian nasional dan nilai
sekolah.
Permendiknas No. 63 tahun 2009 tentang Sistem Penjaminan Mutu
Pendidikan (SPMP) pasal 20 dimana dinyatakan salah satu jenis kegiatan
penjaminan mutu pendidikan adalah evaluasi dan pemetaan mutu satuan atau
program pendidikan oleh Pemerintah, pemerintah provinsi, dan pemerintah
kabupaten atau kota. Pemerintah telah menentukan kebijakan dalam
meningkatkan standar mutu pendidikan dengan melakukan Ujian Nasional (UN)
dan Ujian Sekolah (US) setiap tahunnya.
Konsep clustering adalah membagi data menjadi kelompok-kelompok
dapat membantu dalam proses pengelompokan Sekolah Menengah Atas
khususnya yang ada di DIY berdasarkan data Nilai Ujian Nasional dan Nilai
Sekolah.
Berdasarkan hal diatas, maka penulis tertarik untuk mengimplementasikan
algoritma Fuzzy C-Means dan mengangkat judul skripsi yaitu “Implementasi
Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Atas di DIY
berdasarkan Nilai Ujian Nasional dan Nilai Sekolah” untuk membantu dan
mempermudah dalam proses pengelompokan data Sekolah Menengah Atas
dengan algoritma Fuzzy C-Means .
1.2 Rumusan Masalah
Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan
adalah:
1. Bagaimana mengimplementasikan algoritma Fuzzy C-Means untuk
mengelompokkan sekolah menengah atas di DIY berdasarkan nilai
Ujian Nasional dan Nilai Sekolah?
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
2. Apakah implementasi algoritma Fuzzy C-means dapat dipergunakan
untuk mengelompokan sekolah dengan valid?
1.3 Tujuan
Penelitian ini bertujuan membantu, mendesain, mengimplementasikan
algoritma Fuzzy C-Means untuk mempermudah pengguna dalam
mengelompokkan Sekolah Menengah Atas berdasarkan nilai ujian nasional dan
nilai sekolah dengan algoritma Fuzzy C-Means.
1.4 Batasan Masalah
Batasan masalah dalam penelitian ini adalah:
1. Metode yang digunakan dalam penelitian ini adalah metode clustering
algoritma Fuzzy C-Means
2. Data uji yang digunakan adalah data nilai ujian nasional dan nilai Sekolah
Menengah Atas di Daerah Istimewa Yogyakarta pada tahun 2011 - 2014.
3. Atribut-atribut clusteringnya berupa nilai mata ujian sekolah (US) dan
ujian nasional (UN) yang diujikan di jurusan IPA dan IPS di wilayah
provinsi DIY . Meliputi, nilai mata pelajaran Bahasa Indonesia, Bahasa
Inggris, Matematika, Kimia, Fisika, Biologi untuk jurusan IPA, dan nilai
mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, Geografi,
Sosiologi, Ekonomi untuk jurusan IPS.
4. Aplikasi akan dibuat mengunakan pemrograman Java Desktop Standard
Edition (J2SE).
1.5 Manfaat Penelitian
Manfaaat yang diperoleh dalam penelitian ini antara lain:
1. Memberikan gambaran tentang langkah – langkah desain, dan
implementasi algoritma Fuzzy C-Means dalam menghasilkan
pengelompokan Sekolah Menengah Atas berdasarkan nilai ujian
nasional dan nilai sekolah.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
2. Sebagai refensi bagi penelitian yang berkaitan dengan clustering
pemetaan atau pengelompokan sekolah yang lebih lanjut.
1.6 Metodologi Penelitian
Metode yang dipergunakan untuk merancang sistem dan menyelesaikan
permasalahan adalah dengan cara sebagai berikut.
1. Studi pustaka
Penyusun mencari liteatur-literatur untuk mengenal dan mempelajari cara
kerja dari algoritma Fuzzy C-Means.
2. Pengembangan Sistem
Pada tahap ini penulis menggunakan paradigma waterfall. Adapun
metode waterfall mempunyai tahapan-tahapan sebagai berikut :
Gambar 1.1 Metodologi Perangkat Lunak (Classic life Cycle/Waterfall)
(Pressman,2002)
Keterangan :
a. Rekayasa perangkat lunak (Software Engineering), merupakan
kegiatan untuk menentukan software apa yang akan dibangun.
b. Analisis perangkat lunak (Software Analysis), dilakukan dengan cara
menganalisa kebutuhan akan fungsi – fungsi perangkat lunak yang
Analysis
Design
Coding
Testing
Maintenance
Sistem
Engineering
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
dibutuhkan. Adapun fungsi – fungsi tersebut meliputi fungsi
masukan, fungsi proses, dan fungsi keluaran.
c. Perancangan perangkat lunak (Software Design), merupakan
perancangan perangkat lunak yang dilakukan berdasarkan data – data
yang telah dikumpulkan pada tahap sebelumnya. Perancangan
tersebut meliputi perancangan struktur file, struktur menu, struktur
program, format masukan (input), dan format keluaran (output).
d. Implementasi perangkat lunak (Coding), yaitu kegiatan yang
mengimplementasikan hasil dari perancangan perangkat lunak
kedalam kode program yang dimengerti oleh bhasa mesin.
e. Pengujian perangkat lunak (Testing), memfokuskan pada logika
internal dari perangkat lunak, fungsi eksternal, dan mencari segala
kemungkinan kesalahan, memeriksa apakah input sesuai dengan
hasil yang diinginkan setelah proses.
f. Pemeliharaan perangkat lunak (Maintenance), merupakan suatu
kegiatan untuk memelihara perangkat lunak yang sudah dibuat,
pemeliharaan tersebut dilakukan agar keutuhan program dapat
terjaga seperti validasi data, update data, dan integrasi data.
3. Validasi hasil
Pada tahap ini dilakukan validasi terhadap hasil pengujian aplikasi
terhadap hasil perhitungan manual, dan dengan hasil uji algoritma FCM dengan
tools matlab
1.7 SISTEMATIKA PENULISAN
Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematika
penulisan sebagai berikut:
BAB I. PENDAHULUAN
Pendahuluan berisi tentang latar belakang masalah, rumusan masalah,
tujuan, batasan masalah, manfaat penelitian, metode penelitian dan sistematika
penulisan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
BAB II. TINJAUAN PUSTAKA DAN DASAR TEORI
Tinjauan pustaka dan dasar teori berisi tentang sumber acuan , penjelasan
dan uraian singkat mengenai teori-teori yang berkaitan dengan topik dari tugas
akhir ini.
BAB III. ANALISIS DAN PERANCANGAN SISTEM
Analisis dan perancangan sistem berisi tentang identifikasi sistem meliputi
Analisa kebutuhan, use case diagram, input, proses dan output, kebutuhan
perangkat keras dan perangkat lunak, serta perancangan sistem seperti,disain
umum sistem, , activity diagram, class diagram, ,sequence diagram, dan
rancangan antarmuka sistem.
BAB IV. IMPLEMENTASI DAN PEMBAHASAN SISTEM
Implementasi sistem berisi tentang implementasi program dari sistem yang
akan dibuat, pembahasan sistem, implementasi antarmuka, hasil implementasi
pemrograman, dan pengujian sistem dengan data yang sudah siap untuk diproses.
BAB V. KESIMPULAN DAN SARAN
Kesimpulan dan saran berisi tentang kesimpulan dari sistem yang telah
dibuat, serta saran untuk pengembangan dan penyempurnaan Tugas Akhir yang
dibuat
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
BAB II
TINJAUAN PUSTAKA DAN DASAR TEORI
2.1 Tinjauan Pustaka
Asih (2008) meneliti tentang penerapan algoritma Fuzzy C-Means untuk
pengelompokan penduduk berdasarkan kemampuan ekonominya. Penelitian ini
menggunakan kriteria jumlah penghasilan, luas bangunan tempat tinggal dan
rekening listrik sebagai atribut pengelompokan. Hasil dari penelitian ini berupa
suatu aplikasi yang dapat mengelompokan penduduk menjadi 2 cluster yakni
mampu dan tidak mampu, serta juga dapat mengelompokkan penduduk menjadi 4
cluster yaitu penduduk Pra Sejahtera, Keluarga Sejahtera I, Keluarga Sejahtera II
dan Keluarga Sejahtera III.
Ernawati dan Susanto (2009), meneliti tentang penerapan Fuzzy Clustering
untuk pembagian kelas peserta kuliah . Penelitian ini menggunakan sampel 121
orang mahasiswa Jurusan Teknik Informatika Universitas Atma Jaya Yogyakarta
yang menempuh perkuliahan Struktur Data Lanjut. Setiap mahasiswa dicirikan
oleh dua atribut, yaitu nilai yang pernah mereka peroleh untuk dua mata kuliah
prasyarat (Algoritma dan Pemrograman dan Struktur Data). Dalam pembahasan
untuk menilai anggota kelompok yang sah dan valid, menggunakan ukuran
Fukuyama-Sugeno’s Fuzzy Cluster Validity Index. Hasil dari penelitian ini adalah
pembagian kelas para peserta kuliah sebagai hasil penerapan algoritma Fuzzy
Clustering terhadap data ke-121 peserta mata kuliah Struktur Data Lanjut untuk
pelbagai kemungkinan jumlah kelas, dan rekomendasi peserta kelas yang valid.
Luthfi (2007), meneliti tentang algoritma Fuzzy C-Means untuk Clustering
Data Performance Mengajar Dosen Dalam penelitian tersebut dilakukan
percobaan untuk mengetahui kemungkinan adanya cluster-cluster dari data
performance mengajar dosen. Penelitian menggunakan beberapa kriteria sebagai
acuan dalam proses clustering yaitu: penguasaan dan kemampuan dalam
menjelaskan materi, kemampuan dalam menjawab pertanyaan, kemampuan dalam
member motivasi mahasiswa, kemampuan dalam membuat suasana kelas
menyenangkan dan kedisiplinan hadir dalam perkuliahan. Penelitian ini berhasil
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
memunculkan beberapa custer data yang dapat dianalisis lebih lanjut persamaan
dan perbedaannya. Dari 4 pusat cluster yang di set di awal iterasi, ada 2 cluster
yang mempunyai nilai sama, yaitu cluster 3 dan cluster 4, dengan demikian hanya
dihasilkan 3 buah cluster performance mengajar dosen.
2.2 Dasar Teori
2.2.1 Ujian Nasional (UN) dan Ujian Sekolah (US)
2.2.1.1 Ujian Nasional (UN)
Ujian nasional (UN) merupakan kebijakan pemerintah dalam bidang
pendidikan untuk menentukan standar mutu pendidikan. Pemerintah telah
menetapkan nilai standar kelulusan UN minimal yang harus dicapai oleh peserta
didik dalam kelulusan.
Tujuan UN adalah untuk mengukur pencapaian hasil belajar siswa;
mengukur mutu pendidikan di tingkat nasional, provinsi, kabupaten atau kota, dan
sekolah/madrasah; dan mempertanggungjawabkan penyelenggaraan pendidikan
secara nasional, provinsi, kabupaten atau kota, dan sekolah/ madrasah, kepada
masyarakat. UN tetap penting karena tidak hanya untuk memetakan kualitas
sekolah, tetapi juga mengetahui kualitas murid dan standarisasi pendidikan. UN
adalah sebuah tes yang dikategorikan sebagai high-stakes (taruhan besar) karena
digunakan untuk menjadi penentu utama dalam menilai siswa, dan bahkan
menjadi penentu utama untuk menetapkan apakah seorang siswa lulus atau tidak.
Dalam pelaksanaan UN 2014, Badan Standar Nasional Pendidikan
(BSNP) menerbitkan Prosedur Operasi Standar Kelulusan UN 2014 SMP/MTs,
SPMLB dan SMK No. 22 Th 2013. Pemerintah telah mengambil kebijakan untuk
menerapkan UN sebagai salah satu bentuk evaluasi pendidikan. Menurut Surat
Edaran Bersama Menteri Pendidikan Nasional No.420 tahun 2014 tentang UN
tahun pelajaran 2013/2014 disebutkan bahwa tujuan UN adalah untuk mengukur
pencapaian hasil belajar peserta didik melalui pemberian tes pada siswa SLTP dan
siswa SLTA. Selain itu UN bertujuan untuk mengukur mutu pendidikan dan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
mempertanggungjawab-kan penyelengga-raan pendidikan di tingkat nasional,
provinsi, kabupaten, sampai tingkat sekolah.
UN berfungsi sebagai alat pengendalian mutu pendidikan secara nasional,
pendorong peningkatan mutu pendidikan secara nasional, bahan dalam
menentukan kelulusan peserta didik, dan sebagai bahan pertimbangan dalam
seleksi penerimaan pada jenjang pendidikan yang lebih tinggi. UN merupakan
salah satu bentuk evaluasi belajar pada akhir tahun pelajaran yang diterapkan pada
beberapa mata pelajaran yang dianggap penting.
2.2.1.2 Ujian Sekolah (US)
US adalah ujian yang dilaksanakan oleh sekolah, dan mata pelajaran yang
diujikan dtentukan oleh sekolah sendiri. Untuk dinyatakan lulus, bukan hanya
lulus UN berarti dinyatakan lulus. Tetapi harus US juga dinyatakan lulus. Hasil
lulus UN dan UAS ini sangat penting dalam kelulusan siswa. Jika salah satunya
tidak lulus sama dengan tidak lulus.
2.2.1.3 Standar Kelulusan
Sistem penilaian biasa digunakan, yakni penilai acuan norma (PAN) dan
penilaian acuan patokan (PAP). Batas kelulusan hasil penilaian mempunyai kaitan
dengan kedua sistem penilai tersebut. Dengan demikian, ada batas kelulusan yang
berorientasi pada PAN, yakni batas lulus aktual dan batas lulus ideal. Di samping
itu ada batas kelulusan yang berorientasi kepada sistem PAP, yakni batas lulus
purposif. Deskripsi ketiga batas kelulusan di atas sebagai berikut.
1. Batas lulus aktual.
Batas lulus aktual didasarkan atas nilai rata-rata yang dapat dicapai oleh
kelompok siswa. Unsur yang diperlukan untuk menentukan batas lulus
actual adalah nilai rata-rata aktual dan simpangan baku aktual. Biasanya
skor yang dinyatakan lulus adalah skor di atas ( X + 0,25 SD ) dimana X
adalah nilai rata-rata kelas dan SD adalah simpangan baku. Misalnya siswa
kelas III SMA diberi tes bahasa Inggris dengan menggunakan bentuk
pilihan ganda sebanyak 60 pertanyaan. Setiap pertanyaan yang dijawab
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
benar diberi skor satu, sehingga skor maximal yang mungkin dicapai
adalah siswa sebanyak 60. kemudian dihitung nilai rata-ratanya (X) dari
semua siswa yang ada di kelas tersebut, misalnya 25 dan simpangan
bakunya (SD) adalah 8,0. dengan demikian, skor yang dinyatakan lulus
adalah 25 + 0,25 (8,0) = 27, Skor-skor di atas 27 dinyatakan lulus
sedangkan skor di bawah 27 dinyatakan gagal atau tidak lulus.
2. Batas lulus ideal
Batas lulus ideal sama dengan batas lulus aktual, yaitu menentukan batas
lulus dengan menggunakan nilai rata-rata dan simpangan baku ideal. Nilai
rata-rata dan simpangan baku dalam batas lulus ideal mudah dihitung
menggunakan aturan sebagai berikut: Nilai rata-rata ideal adalah setengah
dari maksimum skor. Simpangan baku ideal adalah sepertiga dari nilai
rata-rata ideal. Misalnya, kembali pada contoh dalam batas lulus aktual.
Skor maksimum yang mungkin dicapai dari tes bahasa Inggris adalah 60.
rata-rata idealnya adalah setengah dari 60, yakni 30, sedangkan simpangan
bakunya adalah sepertiga dari rata-rata ideal, yakni 10. batas lulusan
idealnya adalah 30 + 0,25 (10) = 32,50. skor dia atas 32,50 dinyatakan
lulus, sedangkan skor di bawah 32,50 dinyatakan gagal atau tidak lulus.
3. Batas lulus purposif
Batas lulus purposif mengacu pada PAP sehingga tidak perlu menghitung
nilai rata-rata dan simpangan baku. Dalam hal ini ditentukan kriteria-nya,
misalnya 75%. Artinya skor yang dinyatakan lulus adalah skor di atas 75
% dari skor maksimum. Pada contoh di atas maka batas lulusnya adalah
75% dari 60, yakni 45. skor yang besarnya di atas 45 dinyatakan lulus dan
yang berada di bawahnya dinyatakan gagal atau tidak lulus. Makin tinggi
kriteria kelulusannya, maka makin tinggi pula kualitas hasil belajar yang
dituntutnya. Sebaliknya, makin rendah kriterianya, makin rendah pula
kualitas hasil belajar yang dihasilkannya (Sudjana, 2001:106-107).
Standar kriteria kelulusan dalam UAN sudah ditetapkan dalam POS
kelulusan UN yaitu 5,5. Artinya skor di atas 5,5 dinyatakan lulus,
sedangkan skor di bawah 5,5 dinyatakan gagal atau tidak lulus. Batas
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
kelulusan yang digunakan dalam UN adalah menggunakan sistem
penilaian acuan patokan (PAP), yakni batas lulus purposif. Hasil UN
digunakan sebagai salah satu pertimbangan untuk (PerMenDikBud
No.3/2013):
1. Pemetaan mutu satuan dan/atau program pendidikan
2. Seleksi masuk jenjang berikutnya
3. Penentuan kelulusan peserta didik dari suatu satuan pendidikan
4. Akreditasi satuan pendidikan
5. Pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upaya
peningkatan mutu pendidikan.
2.2.2 Knowledge Discovery in Database (KDD)
Knowledge Discovery in Database (KDD) adalah kegiatan yang meliputi
pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau
hubungan dalam set data berukuran besar. Data mining (Penambangan data)
merupakan bagian dari Knowledge Discovery in Database yang merupakan
kegiatan yang meliputi pengumpulan , pemakaian data historis untuk menemukan
keteraturan, pola atau hubungan dalam data yang berukuran besar (Santosa, 2007).
Istilah data mining dan KDD sering disalah artikan secara bergantian untuk
menjelaskan proses penggalian informasi tersembunyi dalam suatu kumpulan data
yang besar. Data mining dan KDD memiliki konsep yang berbeda tetapi saling
berkaitan satu sama lain. Salah satu tahapan dalam proses KDD adalah data
mining (Han&Kamber,2006). Sebagai komponen dalam KDD, data mining
berkaitan dengan ekstrasi dan penghitungan pola-pola dari data yang terdembunyi
dalam database.
Tahapan KDD merupakan suatu rangkaian proses data mining dan dapat
dibagi menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif di mana
pemakai terlibat langsung atau melalui perantara knowledge base.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
Gambar 2.1 Tahapan proses sebuah sistem KDD
(Jiawei Han &Micheline Kamber,2006)
Tahapan prosesnya yaitu :
1. Pembersihan data (data cleaning)
Pada tahap ini dilakukan untuk proses pembersihan data untuk
menghilangkan noise dan data yang konsisten atau data tidak relevan. Secara
umum data yang diperoleh, memiliki data-data yang tidak sempurna seperti data
yang hilang atau data yang tidak lengkap,data yang mengandung noise, data yang
tidak konsisten atau juga hanya sekedar salah ketik.
2. Integrasi data (data integration)
Pada tahap ini , dilakukan penggabungan data dari berbagai sumber-sember
yang berbeda ke dalam satu database. Integrasi data dilakukan pada atribut-aribut
yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis
produk, nomor pelanggan dan lainnya.
3. Seleksi Data (Data Selection)
Pada proses ini , data yang ada pada database akan diseleksi dan diambil
data yang relevan atau sesuai untuk dianalisis.
4. Transformasi data (Data Transformation)
Pada tahap ini data diubah ke dalam format yang sesuai untuk diproses
dalam data mining. Beberapa metode data mining membutuhkan format data yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
khusus sebelum bisa diaplikasikan. Proses ini meliputi : penghalusan, agregasi,
generalisasi dari data, normalisasi dan konstruksi atribut atau fitur.
5. Proses data mining
Pada tahap ini, merupakan suatu proses utama saat metode diterapkan untuk
mengekstrasi pola data, menemukan pengetahuan atau knowledge yang berharga
dan tersembunyi dari data.
6. Evaluasi pola (pattern evaluation),
Pada tahap ini, dilakukan identifikasi pola-pola yang meresentasikan
knowledge atau berdasarkan beberapa pengukuran yang menarik atau penting.
7. Presentasi pengetahuan (knowledge presentation),
Pada tahap ini, merupakan visualisasi dan penyajian pengetahuan mengenai
metode yang digunakan untuk memperoleh pengetahuan yang diperoleh
pengguna. Tahap terakhir dari proses data mining adalah bagaimana
memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Dalam
presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data
mining.
Tahap 1 sampai tahap 4 termasuk dalam data preprocessing, dimana data
disiapkan untuk di mining. Setelah melakukan tahapan preprocessing maka
hasilnya siap di proses mining. Data yang dipakai merupakan sekumpulan obyek
data dan atribut.
2.2.3 Konsep Clustering
Konsep dasar data mining (penambangan data) adalah menemukan
informasi tersembunyi dalam sebuah basis data dan merupakan bagian dari
Knowledge Discovery in Database (KDD) untuk menemukan informasi dan pola
yang berguna dalam data (Dunham, 2003). Data mining mencari informasi baru,
berharga dan berguna dalam sekumpulan data dengan melibatkan komputer dan
manusia serta bersifat iteratif baik melalui proses yang otomatis ataupun manual.
Secara umum sifat data mining adalah:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
a. Predictive: menghasilkan model berdasarkan sekumpulan data yang dapat
digunakan untuk memperkirakan nilai data yang lain. Metode yang termasuk
dalam prediktif data mining adalah:
1) Klasifikasi: pembagian data ke dalam beberapa kelompok yang telah
ditentukan sebelumnya.
2) Regresi: memetakan data ke suatu prediction variable.
3) Time Series Analisys: pengamatan perubahan nilai atribut dari waktu ke
waktu.
b. Descriptive: mengidentifikasi pola atau hubungan dalam data untuk
menghasilkan informasi baru. Metode yang termasuk dalam deskriptif data
mining adalah:
1) Clustering: identifikasi kategori untuk mendeskripsikan data.
2) Association Rules: Identifikasi hubungan antar data yang satu dengan yang
lainnya.
3) Summarization: pemetaan data ke dalam subset dengan deskripsi
sederhana.
4) Sequence Discovery: identifikasi pola sekuensial dalam data
Clustering membagi data menjadi kelompok-kelompok atau cluster
berdasarkan suatu kemiripan atribut-atribut diantara data tersebut(Dunham, 2003).
Karakteristik tiap cluster tidak ditentukan sebelumnya, melainkan tercermin dari
kemiripan data yang terkelompok di dalamnya. Oleh sebab itu hasil clustering
seringkali perlu diinterprestasikan oleh pihak-pihak yang benar-benar mengerti
mengenai karakter domain data tersebut. Selain digunakan sebagai metode yang
independen dalam data mining, clustering juga digunakan dalam pra-pemrosesan
data sebelum data diolah dengan metode data mining yang lain untuk
meningkatkan pemahaman terhadap domain data.
Karakteristik terpenting dari hasil clustering yang baik adalah suatu
instance data dalam suatu cluster lebih ”mirip” dengan instance lain di dalam
cluster tersebut daripada dengan instance di luar dari cluster itu (Kantardzic,
2003). Ukuran kemiripan (similarity measure) tersebut bisa bermacam-macam
dan mempengaruhi perhitungan dalam menentukan anggota suatu cluster. Jadi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
tipe data yang akan di-cluster (kuantitatif atau kualitatif) juga menentukan ukuran
apa yang tepat digunakan dalam suatu algoritma. Selain kemiripan antar data
dalam suatu cluster, clustering juga dapat dilakukan berdasarkan jarak antar data
atau cluster yang satu dengan yang lainnya.Ada beberapa macam rumus
perhitungan jarak antar cluster. Untuk Tipe data numerik, sebuah data set X
beranggotakan x1∈ X, i = 1, ..., n, tiap item direpresentasikan sebagai vektor X1=
{Xi1, Xi2, Xim} dengan m sebagai jumlah dimensi dari item. Rumus-rumus yang
biasa digunakan sebagai ukuran jarak antara
Xi dan Xj untuk data numerik ini antara lain:
a. Euclidean Distance
..................................................(2.1)
Ukuran ini sering digunakan dalam clustering karena sederhana. Ukuran
ini memiliki masalah jika skala nilai atribut yang satu sangat besar
dibandingkan nilai atribut lainnya. Oleh sebab itu, nilai-nilai atribut sering
dinormalisasi sehingga berada dalam kisaran 0 dan 1.
b. Manhattan Distance
..............................................................(2.2)
Jika tiap item digambarkan sebagai sebuah titik dalam grid, ukuran jarak
ini merupakan banyak sisi yang harus dilewati suatu titik untuk mencapai
titik yang lain seperti halnya dalam sebuah peta jalan.
c. Minkwoski Metric
...........................................................(2.3)
Ukuran ini merupakan bentuk umum dari Euclidean Distance dan
Manhattan Distance. Euclidean Distance adalah kasus dimana nilai p=2
sedangkan Manhattan Distance merupakan bentuk Minkwoski dengan
p=1. Dengan demikian, lebih banyak nilai numerik yang dapat
ditempatkan pada jarak terjauh di antara 2 vektor. Seperti pada Euclidean
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
Distance dan juga Manhattan Distance, ukuran ini memiliki masalah jika
salah satu atribut dalam vektor memiliki rentang yang lebih besar
dibandingkan atribut-atribut lainnya.
d. Cosine – Corelation (ukuran kemiripan dari model Euclidean n-dimensi)
..........................................................(2.4)
Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi
walaupun sering pula digunakan bersama pendekatan lain untuk
membatasi dimensi dari permasalahan.
Dalam mendefenisikan ukuran jarak antar cluster yang digunakan
beberapa algoritma untuk menentukan cluster mana yang terdekat, perlu
dijelaskan mengenai atribut-atribut yang menjadi referensi dari suatu cluster
(Kantardzic, 2003). Untuk suatu cluster Km berisi N item {Xm1, Xm2, ...,
Xmn}:
a) Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap
itemdari suatu cluster menurut rumus:
...........................................................(2.5)
b) Medoid: item yang letaknya paling tengah
2.2.4 Algoritma Fuzzy C-Means (FCM)
Ada beberapa algoritma clustering data, salah satu diantaranya adalah
Fuzzy C-Means (FCM). FCM adalah suatu teknik clustering data yang mana
keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat
keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun
1981.
Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang
akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat
cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat
keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa
pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan
pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang
diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data
tersebut.
Dalam metode Fuzzy C Means dipergunakan variabel membership
fucntion iku, yang merujuk pada seberapa besar kemungkinan suatu data bisa
menjadi anggota ke dalam suatu cluster . Pada metode ini juga digunakan
suatu variabel m yang merupakan weighting exponent dari membership function.
Variabel ini dapat mengubah besaran pengaruh dari membership function iku
dalam proses clustering. Variabel m mempunyai wilayah nilai m > 1 , sampai
pada saat ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal
dalam melakukan optimasi suatu permasalahan clustering. Nilai m yang umum
digunakan adalah 2 (Wahyuni,2009) .
Secara mendasar terdapat dua cara pengalokasian data kembali kedalam
masing-masing cluster pada saat proses iterasi clustering. Yang pertama adalah
pengalokasian dengan cara tegas (hard). Dimana data item secara tegas
dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster
yang lain. Yang kedua dengan menggunakan nilai Fuzzy dimana masing-masing
data item diberikan nilai kemungkinan untuk bisa bergabung ke setiap cluster
yang ada. Pada K-Means pengalokasian data kembali didasarkan pada
perbandingan jarak antara data dengan centroid setiap cluster yang ada. Pada
Fuzzy C Means pengalokasian kembali data kedalam masing-masing cluster
dipergunakan variabel membership function uik yang merujuk pada seberapa besar
kemungkinan suatu data bisa menjadi anggota dalam satu cluster.
Keluaran dari FCM bukan merupakan sistem inferensi fuzzy, namun
merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap –
tiap titik data.
Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut (Kusumadewi,2010).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
1. Masukan data yang akan di cluster U , berupa matriks berukuranmxn (n =
jumlah sampel data,m = atribut setiap data). Uik = data sampel ke-i (
i=1,2,...,n),atribut ke- k( k =1,2,...,m).
2. Menetapkan nilai pangkat w (misal: w=2), Eps/galat terkecil (misal:10-5),
MaxIter (misal:100), jumlah cluster c > 1, dan iterasi awal t = 1,
Menetapkan fungsi objektif awal: Pt(c) = 0.
3. Menetapkan matriks partisi µf (c) awal sembarang, sebagai berikut.
4. Menaikkan nomor iterasi: t=t+1.
5. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut
sebagai berikut.
6. Memodifikasi tiap-tiap nilai keanggotaan sebagai berikut.
a. Jika yk ≠ vfi,
b. Jika yk = vfi,
µik (yk) = 1, jika i =g;
µik (yk) = 0, jika i ≠g;
7. Menghitung fungsi objektif sebagai berikut.
8. Memodifikasi matriks partisi sebagai berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
9. Memeriksa kondisi untuk berhenti, yaitu:
(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter)
Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-4.
2.2.5 Contoh Penerapan Fuzzy C-Means (FCM)
Berikut contoh penerapan perhitungan FCM pada kasus kunjungan
pariwisata kota Yogyakarta(Y. Aditya,2010), sebagai berikut.
Tabel 2.1 Kunjungan Objek Wisata
Tempat Tahun
2006 2007 2008 2009 2010
Kraton
Yogyakarta 45,450 31,723 43,103 47,486 58,235
Taman Sari 4,104 5,422 5,424 22,292 12,575
Gembira Loka 43,783 45,357 51,066 88,967 86,857
Purawisata 8,615 13,346 11,346 9,460 13,215
Data pada Tabel 2.1 merupakan data kunjungan wisata dari tahun 2006 -
2010 dalam satuan ribuan orang. Berdasarkan data tersebut ditentukan beberapa
parameter sebagai berikut.
1. Banyaknya cluster yang diinginkan; c = 3
2. Pangkat (pembobot); w = 2
3. Maksimum Iterasi; MaksIter = 1
4. Error Terkecil; Eps = 10-3
5. Fungsi Objektif awal Pt(0) = 0
6. Iterasi awal; t = 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
Tabel 2.2 Pembangkitan Matriks partisi Uik
i µik
k1 k2 k3
1 0.8 0.2 0
2 0.1 0.9 0
3 0 0.8 0.2
4 0 1 0
Tabel 2.2 merupakan tahap ke-3 dari perhitungan FCM. Bangkitkan
matriks µik dengan komponen i= banyaknya data; k= banyak cluster (acak dari
nilai 0 - 1). Kemudian ubah nilai iterasi menjadi t=1.
Langkah selanjutnya adalah menghitung pusat cluster v dengan rumus
algoritma langkah 5, sebagai berikut.
Tabel 2.3 Perhitungan Pusat Cluster v1
i µi1w µi1
w* Xi1 µi1w* Xi2 µi1
w* Xi3 µi1w* Xi4 µi1
w* Xi5
1 0.64 29088 20302.72 27585.92 30391.04 37270.4
2 0.01 41.04 54.22 54.24 222.92 125.75
3 0 0 0 0 0 0
4 0 0 0 0 0 0
Jml 0.65 29129.04 20356.94 27640.16 30613.96 37396.15
Tabel 2.4 Perhitungan Pusat Cluster v2
i µi2w µi2
w* Xi1 µi2w* Xi2 µi2
w* Xi3 µi2w* Xi4 µi2
w* Xi5
1 0.04 1818 1268.92 1724.12 1899.44 2329.4
2 0.81 3324.24 4391.82 4393.44 18056.52 10185.75
3 0.64 28021.12 29028.48 32682.24 56938.88 55588.48
4 1 8615 13346 11346 9460 13215
Jml 2.49 41778.36 48035.22 50145.8 86354.84 81318.63
Tabel 2.5 Perhitungan Pusat Cluster v3
i µi3w
µi3w*
Xi1
µi3w*
Xi2
µi3w*
Xi3
µi3w*
Xi4
µi3w*
Xi5
1 0 0 0 0 0 0
2 0 0 0 0 0 0
3 0.04 1751.32 1814.28 2042.64 3558.68 3474.28
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
4 0 0 0 0 0 0
Jml 0.04 1751.32 1814.28 2042.64 3558.68 3474.28
Tabel 2.3 - 2.5 merupakan data perhitungan v yang dipisah kan setiap
komponen µij, sehingga hasil akhir dari perhitungan pusat cluster v, sebagai
berikut.
v11 = 29129.04/0.65 = 44813.908
v12 = 20356.94/0.65 = 31318.369
v13 = 27640.16/0.65 = 42523.323
v14 = 30613.96/0.65 = 47098.4
v15 = 37396.15/0.65 = 57532.538
v21 = 41778.36/2.49 = 16778.458
v22 = 48035.22/2.49 = 19291.253
v23 = 50145.8/2.49 = 20138.876
v24 = 86354.84/2.49 = 34680.659
v25 = 81318.63/2.49 = 32658.084
v31 = 1751.32/0.04 = 43783
v32 = 1814.28/0.04 = 45357
v33 = 2042.64/0.04 = 51066
v34 = 3558.68/0.04 = 88967
v35 = 3474.28/0.04 = 86857
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Langkah berikutnya adalah menghitung fungsi objektif sebagai berikut.
Cluster 1 :
(Xi1 - Vi1)2 (Xi2 -
Vi2)2
(Xi3 -
Vi3)2
(Xi4 -
Vi4)2
(Xi5 -
Vi5)2 P1
404,613 163,726 336,025 150,234 493,452 1,548,051
1,657,296,584 670,621,939 1,376,359,773 615,357,481 2,021,180,265 6,340,816,042
1,062,771 197,083,154 72,977,329 1,752,979,666 859,924,045 2,884,026,964
1,310,360,918 323,006,056 972,025,474 1,416,649,155 1,964,044,215 5,986,085,818
LT1 15,212,476,875
Cluster 2 :
(Xi1 -
Vi1)2
(Xi2 -
Vi2)2
(Xi3 -
Vi3)2 (Xi4 - Vi4)2 (Xi5 - Vi5)2 P2
822,057,330 154,548,333 527,351,014 163,976,767 654,178,615 2,322,112,060
160,641,881 192,356,179 216,527,561 153,478,863 403,330,277 1,126,334,761
729,245,298 679,423,166 956,487,030 2,947,006,859 2,937,522,459 8,249,684,811
66,642,044 35,346,033 77,314,660 636,081,622 378,033,529 1,193,417,887
LT2 12,891,549,519
Cluster 3 :
(Xi1 -
Vi1)2
(Xi2 -
Vi2)2
(Xi3 -
Vi3)2
(Xi4 -
Vi4)2
(Xi5 -
Vi5)2 P3
2,778,889 185,885,956 63,409,369 1,720,673,361 819,218,884 2,791,966,459
1,574,423,041 1,594,804,225 2,083,192,164 4,445,555,625 5,517,815,524 15,215,790,579
0 0 0 0 0 0
1,236,788,224 1,024,704,121 1,577,678,400 6,321,363,049 5,423,144,164 15,583,677,958
LT3 33,591,434,996
Kemudian langkah selanjutnya merupakan perhitungan untuk
memperbarui keanggotaan matriks µij, sebagai berikut.
I µij µij µij
1 0.000101762 0.180126683 0.083115427
2 0.416816807 0.087370006 0.452966376
3 0.189582997 0.639929653 0
4 0.393498433 0.092573657 0.463918197
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
Langkah selanjutnya adalah menghitung kondisi berhenti, dengan pembulatan
nilai desimal yaitu :
(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter)
i P - 0
1 0 0.18 0.08
2 0.42 0.09 0.45
3 0.19 0.64 0
4 0.39 0.09 0.47
Dikarenakan hasilnya belum memenuhi lebih kecil dari Eps/galat = 0,01
maka iterasi berulang sampai galat terpenuhi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
BAB III
ANALISIS DAN PERANCANGAN SISTEM
3.1 Analisis Kebutuhan
3.1.1 Identifikasi sistem
Permendiknas No. 63 tahun 2009 tentang Sistem Penjaminan Mutu
Pendidikan (SPMP) pasal 20 dimana dinyatakan salah satu jenis kegiatan
penjaminan mutu pendidikan adalah evaluasi dan pemetaan mutu satuan atau
program pendidikan oleh Pemerintah, pemerintah provinsi, dan pemerintah
kabupaten atau kota. Pemerintah telah menentukan kebijakan dalam
meningkatkan standar mutu pendidikan dengan melakukan Ujian Nasional (UN)
dan Ujian Sekolah (US) setiap tahunnya.
Konsep clustering adalah membagi data menjadi kelompok-kelompok
dapat membantu dalam proses pengelompokan Sekolah Menengah Atas
khususnya yang ada di DIY berdasarkan data Nilai Ujian Nasional dan Nilai
Sekolah.
Sistem ini merupakan implementasi algoritma Fuzzy C-means untuk
melakukan proses pengelompokan (clustering) . Data yang digunakan pada sistem
ini merupakan data yang sudah siap untuk diproses clustering. Data yang
digunakan dalam penelitian yaitu data nilai Ujian Nasional(UN) dan Nilai
Sekolah(NS) khususnya Sekolah Menengah Atas (SMA) di Provinsi DIY tahun
pelajaran 2011 - 2014. Data nilai yang digunakan meliputi nilai mata pelajaran
Bahasa Indonesia, Bahasa Inggris, Matematika, Kimia, Fisika, Biologi untuk
jurusan IPA, dan nilai mata pelajaran Bahasa Indonesia, Bahasa Inggris,
Matematika, Geografi, Sosiologi, Ekonomi untuk jurusan IPS.
Sistem ini bertujuan untuk membantu dan mempermudah Dinas
Pendidikan dalam proses pengelompokkan Sekolah Menengah Atas dengan
menggunakan algoritma Fuzzy C-means.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
3.1.2 Use case Diagram
Diagram use case digunakan untuk menggambarkan interaksi antara
pengguna dengan sistem. Pengguna sistem ini sebanyak satu orang. Fungsi yang
dapat dijalankan oleh pengguna sistem ini adalah fungsi memasukkan data dalam
bentuk file .xls, atau .csv. Fungsi berikutnya itu seleksi atribut dan distribusi
atribut. Fungsi berikutnya yaitu fungsi proses clustering dengan memasukkan
nilai k,w,i dan e. Fungsi berikutnya yaitu fungsi lihat grafik plot hasil clustering,
dan simpan hasil clustering. Fungsi terakhir yaitu fungsi lihat bantuan. Gambar
dari use case diagram aplikasi dapat dilihat pada Gambar 3.1.
Gambar 3.1 Use Case Diagram
3.1.3 Input Sistem
Sistem clustering dengan algoritma Fuzzy C-Means hanya dapat menerima
masukan dari pengguna berupa file berekstensi .xls atau .csv yang berisi data nilai
ujian nasional dan nilai sekolah pada sekolah menengah atas di Daerah Istimewa
Yogyakarta. Data diambil pada tahun 2011-2014 khususnya jurusan IPA dan IPS.
3.1.4 Proses Sistem
Sistem implementasi algoritma Fuzzy C-Means untuk pengelompokan
sekolah menengah atas di DIY berdasarkan nilai ujian nasional dan nilai sekolah
ini memiliki beberapa tahapan proses. Pertama, pengguna memasukkan data yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
akan diolah dalam bentuk file berformat .xls atau .csv. Kedua, pengguna dapat
melakukan seleksi atribut serta melihat distribusi atribut. Seleksi atribut
digunakan untuk memilih atribut tertentu yang akan dihapus. Distribusi atribut
digunakan untuk melihat variasi nilai dalam setiap atribut berserta jumlahnya
dalam bentuk tabel. Tahap kedua ini merupakan tahap pilihan sehingga tidak
harus dikerjakan. Ketiga, pengguna harus memasukkan jumlah cluster (k), jumlah
pembobot(w), maksimum iterasi(i), toleransi kesalahan/Galat(e). Kemudian
sistem akan melakukan proses clustering sesuai dengan algoritma Fuzzy C-Means
sebagai berikut :
1. Membentuk matriks partisi awal keanggotaan (Uik) yg nilai awalnya acak,
i= banyak data, k = banyak kluster(antara0 -1),
2. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut,
3. Menghitung fungsi objektif ,
4. Memodifikasi matriks partisi sebagai berikut.
5. Memeriksa kondisi untuk berhenti,(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter),
Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-2.
6. Menampilkan hasil dari algoritma Fuzzy C-Means berupa fungsi objektif
(Pt), matriks keanggotaan (µik) dan pusat kluster (Vkj).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
Gambar 3.2 Flowchart Algoritma Fuzzy C-Means
(Kusumadewi,2010).
3.1.5 Output Sistem
Keluaran yang diperoleh dari sistem yang dibangun adalah data-data yang
sudah dikelompokkan dan hasil grafik clustering data sekolah.
Bentuk matriks partisi awal keanggotaan
(Uik) yg nilai awalnya acak, i= banyak
data, k = banyak kluster(antara 0-1)
TIDAK
YA
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
3.1.6 Kebutuhan Perangkat Lunak
Perangkat lunak yang digunakan dalam pembuatan aplikasi ini adalah
Sistem Operasi Windows 7, JDK 1.7, dan NetBeans IDE 7.4.
3.1.7 Kebutuhan Perangkat Keras
Perangkat keras yang digunakan untuk membuat aplikasi ini adalah Laptop
dengan spesifikasi prosessor Intel Core i5, Ram 4 GB, HDD 500 GB.
3.2 Perancangan Sistem
3.2.1 Desain Proses Umum Sistem
Gambar 3.3 Desain Proses buka dan cek berkas input
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Pada gambar 3.3 diperlihatkan proses dari aplikasi mulai dari membuka
berkas berekstensi .xlx atau .csv kemudian aplikasi akan memeriksa kondisi
berkas, jika berkas .xlx atau .csv sesuai dan format penulisannya benar, maka
aplikasi akan melanjutkan menampilkan ukuran dan jumlah instances yang berada
pada berkas. Namun jika tidak maka aplikasi akan memerintahkan untuk
membuka berkas kembali.Setelah berkas diperiksa langkah selanjutnya adalah
merubah isi berkas ke bentuk array list agar dapat diolah oleh aplikasi.
Gambar 3.4 menunjukkan aplikasi memproses clustering menggunakan
algoritma Fuzzy C-Means. Dimulai dari mengambil array list data yang kemudian
diubah ke bentuk matriks (mxn). Proses selanjutnya adalah memasukkan jumlah
cluster yang diinginkan, banyaknya maksimum iterasi dan galat (batas kesalahan
yang diperbolehkan). Aplikasi kemudian akan mengelompokkan data sesuai
algoritma clustering pada Gambar 3.2, terus berulang sampai didapatkan kondisi
selisih fungsi objektif kurang dari galat (Pt(c) - Pt-1(c) < Eps) atau kondisi iterasi
maksimum sudah terpenuhi.
Secara singkat proses dari clustering dalam aplikasi ini adalah menentukan
centroid atau pusat data secara random dari salah satu titik data yang ada pada
instances, sebanyak jumlah cluster yang diinginkan. Proses kemudian dilanjutkan
dengan perhitungan jarak dari titik instances ke centroid. Perhitungan jarak akan
terus dilakukan untuk mencari jarak terdekat semua titik ke centroid yang ada.
Jika semua data instances sudah terkelompokkan, namun masih ada instance yang
tidak sesuai dengan kelompoknya maka aplikasi akan menentukan centroid baru
dengan mencari rata-rata (mean) jarak instance terhadap centroid yang sudah ada.
Proses akan terus berulang sampai ditemukan jarak yang terdekat sesuai
centroid.Jika iterasi cluster sudah mencapai maksimum, atau data instances sudah
terkelompokkan dengan baik, maka aplikasi akan menampilkan data kelompok
tersebut.
Hasil yang ditampilkan oleh aplikasi adalah hasil clustering berupa poin
cluster dan instances data yang termasuk didalamnya, jumlah iterasi yang telah
dilakukan, fungsi objektif yang dicapai (Pt) , nilai kesalahannya serta grafik
clustering .
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Gambar 3.4 Desain Proses Clustering Fuzzy C-Means pada aplikasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
3.2.2 Diagram Aktivitas (Activity diagram)
Diagram aktivitas digunakan untuk menunjukan aktivitas yang dikerjakan
oleh pengguna dan sistem dalam setiap use case yang disebutkan dalam gambar
3.1 Berikut adalah diagram aktivitas dari setiap use case:
1. Diagram Aktivitas Input Data File .xls, .csv
2. Diagram Aktivitas Seleksi Artibut
3. Diagram Aktivitas Distribusi Atribut
4. Diagram Aktivitas Proses Clustering input k,w,i,e
5. Diagram Aktivitas Lihat grafik plot
6. Diagram Aktivitas Simpan Hasil Proses Clustering
7. Diagram Aktivitas Lihat bantuan
Detail diagram aktivitas dari setiap use case dapat dilihat pada bagian
lampiran diagram aktivitas dalam tugas akhir ini.
3.2.3 Diagram Kelas (Class Diagram)
Gambar 3.5 menggambarkan relasi–relasi terjadi antar kelas, kelas
Praproses ber-relasi asosiasi dengan kelas MenuAwal dan kelas FuzzyC-Means,
relasi asosiasi yang dimaksud adalah kelas MenuAwal memanggil fungsi dari
kelas Praproses untuk menampilkan data input, sedangkan kelas FuzzyC-Means
digunakan kelas Praproses untuk menjalankan proses clustering.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
Gambar 3.5 Diagram Kelas
3.2.4 Diagram Sekuen (Sequence Diagram)
Pada Gambar 3.6 diperlihatkan diagram sekuen mengenai pembukaan
berkas.
Gambar 3.6 Diagram Sekuen Buka Berkas
Pengguna MenuAwal Praproses
run()
masuk()
pilihBerkas()
requestInput()
InputFile(.xls || .csv)
cekAtribut()
cekAtribut(OK)
tabelPraproses.setEnabled()
showData()
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
Pengguna melakukan perintah run() kepada objek MenuAwal, kemudian
objek MenuAwal akan menjalankan perintah masuk() ke objek Praproses. Pada
objek Praproses tersebut perintah pilihBerkas() dijalankan, return value dari objek
Praproses diterima pengguna berupa request untuk memasukkan berkas.
Pengguna kemudian memasukkan berkas ekstensi .xls atau .csv ke objek
Praproses, yang kemudian menjalankan perintah cekAtribut(), untuk memeriksa
kondisi atribut dalam berkas. Return message dari objek Praproses kemudian
digunakan untuk mengambil path atau alamat dari berkas yang kemudian akan
ditampilkan kepada pengguna dalam bentuk tabel.
Gambar 3.7 Diagram Sekuen Clustering
Diagram Sekuen pada Gambar 3.7 terdapat suatu message connection
antara objek Pengguna, Praproses, FuzzyCMeans dan PlotKlastering. Pesan yang
Pengguna Praproses Fuzzy CMeans PlotKlastering
run()
klastering()
data(OK)
proses(parameter)
matriksAwal()
hitungPusatKlaster()
fObjektif()
matriksUBaru()
tampilHasil()
plot()
scatter(Tabel)
plotKlaster(OK)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
terjadi dimulai dari Pengguna ketika aplikasi dimulai, objek Pengguna akan
melakukan event meminta run() terhadap Praproses yang kemudian dijawab oleh
objek FuzzyCMeans dengan melakukan klastering(). Setelah mendapatkan return
message data() sudah baik dari objek FuzzyCMeans, maka Pengguna melanjutkan
perintah proses() dengan input parameter klaster, begitu seterusnya sampai pada
akhirnya objek pengguna mendapatkan return message berupa tampilan hasil
analisa clustering dari PlotKlaster.
3.3 Perancangan Antar Muka
Sistem Implementasi algoritma Fuzzy C-Means untuk pengelompokan
Sekolah Menengah Atas di DIY berdasarkan nilai ujian nasional dan nilai sekolah
ini memiliki desain antarmuka yang digunakan untuk melakukan interaksi dengan
pengguna. Antarmuka sistem terdiri dari 6 tampilan yang terdiri dari Halaman
Awal, Halaman Praproses, Halaman Distribusi Atribut, Halaman Fuzzy C-Means,
Halaman Plot Klaster dan Halaman Bantuan.
3.3.1 Halaman Awal
Halaman awal adalah halaman yang digunakan sebagai halaman yang
pertama kali akan muncul ketika aplikasi dijalankan. Halaman ini berisi judul
aplikasi, tombol masuk dan identitas pembuat aplikasi.
Rancangan halaman awal dapat dilihat pada Gambar 3.8 sebagai berikut.
Gambar 3.8 Rancangan Halaman Awal
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
3.3.2 Halaman Praproses
Halaman praproses merupakan halaman yang akan ditampilkan ketika
pengguna menekan tombol masuk pada halaman awal. Halaman ini berfungsi
sebagai sarana pengguna memasukkan data, memeriksa distribusi data dan
menghapus data yang akan di cluster.
Rancangan halaman praproses dapat dilihat pada Gamabr 3.9 sebagai
berikut.
Gambar 3.9 Rancangan Halaman Praproses
3.3.3 Halaman Distribusi Atribut
Halaman distribusi atribut merupakan halaman tambahan yang dapat
digunakan oleh pengguna untuk melihat distribusi atribut dari data yang akan di
cluster. Rancangan dapat dilihat pada gambar 3.10 berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
Gambar 3.10 Rancangan Halaman Distribusi Atribut
3.3.4 Halaman Fuzzy C-Means
Halaman Fuzzy C-Means ini akan ditampilkan saat pengguna menekan
tombo clustering pada halaman praproses sistem. Halaman ini berfungsi sebagai
sarana pengguna untuk mengatur jumlah cluster (klaster), pembobot, maks Iterasi,
dan Toleransi Error untuk melakukan proses clustering Pada halaman ini
pengguna juga dapat melihat plot hasil clustering serta menyimpan hasil dari
proses clustering. Terdapat menu pilihan untuk proses, ulang, plot, simpan dan
kembali. Rancangan dapat dilihat pada gambar 3.11.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Gambar 3.11 Rancangan Halaman Fuzzy C-Means
3.3.5 Halaman Plot Klaster
Rancangan halaman Plot klaster ini digunakan untuk menampilkan hasil
iterasi dan distribusinya pada setiap cluster dalam bentuk grafik tipe XY
(XYSeriresCollection). Rancangannya dapat dilihat pada gambar 3.12 berikut.
Gambar 3.12 Rancangan Halaman Plot Klaster
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
3.3.6 Halaman Bantuan
HalamanBantuan ini ditampilkan saat pengguna menekan tombol Bantuan
di Halaman Utama. Jika ingin keluar dari halaman ini dan kemali ke Halaman
Utama maka pengguna menekan tombol keluar. Halaman Bantuan ini digunakan
untuk menampilkan informasi programmer aplikasi. Rancangannya dapat dilihat
pada gambar 3.13 berikut.
Gambar 3.13 Halaman Bantuan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
BAB IV
IMPLEMENTASI DAN PENGUJIAN SISTEM
Implementasi sistem merupakan prosedur yang harus dilakukan untuk
menyelesaikan pemrograman sistem berdasarkan pada analisis dan perancangan
sistem pada bab sebelumnya. Impementasi sistem pada aplikasi ini dilakukan
dengan menggunakan tools Netbeans Integrated Development Environment (IDE)
7.4 pada komputer dengan spesifikasi prosessor Intel Core i5, RAM 4 GB, HDD
500 GB. Implementasi sistem pada bab ini terdiri dari implementasi antarmuka
dan implementasi kelas. Sedangkan pada pembahasan sistem terdiri dari
pengujian penggunaan sistem dengan data yang sudah siap untuk diproses
clustering dan hasil pengujian. Daftar nama kelas yang diimplementasikan dalam
sistem ini dapat dilihat pada tabel 5.1 berikut.
Tabel 4.1 Tabel nama kelas yang diimplementasikan
No Nama Kelas Nama Berkas
1 Halaman Awal MenuAwal.java
2 Halaman Praproses Data PraprosesGUI.java
3 Halaman Distribusi Atribut DistribusiAtributGUI.java
4 Halaman Fuzzy C-Means FCMGUI.java
5 Halaman Plot Klaster ScatterAdd.java
6 Halaman Bantuan tProgram.java
7 Model Tabel Tabel.java
8 Model Data Data.java
9 Model Hasil Cetak.java
10 Model Seleksi SeleksiAtribut.java
11 Model Check Box CheckBoxTabelModel.java
12 Write TextArea CostumOutputStream.java
13 Write Excel WriteExcel.java
14 Model Fuzzy C-Means FuzzyCMeans.java
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
4.1 Implementasi Antarmuka
Sistem Pengelompokan Implementasi algoritma Fuzzy C-Means untuk
pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai ujian nasional
dan nilai sekolah telah selesai dibangun, maka pada sub bab ini akan ditampilkan
antarmuka dari sistem tersebut.
4.1.1 Implementasi Halaman Awal
Pada saat aplikasi pertama kali dijalankan akan ditampilkan form awal
seperti ditunjukkan pada Gambar 4.1 berikut.
Gambar 4.1 Antarmuka Halaman Awal
Pada halaman awal tersebut terdapat tombol masuk yang akan mengarah
ke halaman proposes data.
4.1.2 Implementasi Halaman Praproses Data
Halaman ini merupakan halaman yang digunakan untuk mempersiapkan
data yang akan diolah yang berasal dari berkas .xls atau .csv. Pengolahan awal
(praproses) data dimaksudkan agar format data sesuai dengan proses
pengelompokan (clustering) yang akan dilakukan. Format data yang
diperbolehkan dalam algoritma Fuzzy C-Means yaitu data dengan format angka
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
(numerik). Implementasi halaman praproses data ditunjukkan pada Gambar 4.2
berikut.
Gambar 4.2 Antarmuka Halaman Praproses Data
Pengguna kemudian dapat memilih tombol “Pilih Berkas” yang digunakan
untuk memasukkan berkas berekstensi .xls atau .csv. Hasil setelah berkas data
dimasukkan seperti ditunjukkan pada Gambar 4.3 berikut.
Gambar 4.3 Antarmuka Halaman Praproses Data (Berkas .xls atau .csv)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Pengguna dapat melakukan seleksi atribut pada tabel atribut, dengan cara
menandai atribut yang ingin dihapus. Atribut yang sudah dilakukan proses hapus
akan hilang dari tabel data. Tampilan penanda hapus atribut seperti ditunjukkan
pada Gambar 4.4 berikut.
Gambar 4.4 Antarmuka Halaman Praproses Data (Hapus Atribut)
4.1.3 Implementasi Halaman Distribusi Atribut
Halaman distribusi atribut digunakan untuk menlihat dan mngetahui
sebaran nilai pada atribut yang dipilih dalam data yang dimasukkan. Halaman ini
akan tampil ketika pengguna memilih tombol “Distribusi Atribut” pada halaman
praproses data. Tampilan halaman distribusi atribut ditunjukkan pada Gambar 4.5
berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
Gambar 4.5 Antarmuka Halaman Distribusi Atribut
4.1.4 Implementasi Halaman Fuzzy C-Means
Halaman ini merupakan halaman utama dalam sistem implementasi
algoritma Fuzzy C-Means untuk pengelompokan sekolah menengah atas di DIY
berdasarkan nilai ujian nasional dan nilai sekolah (FCM).
Isi dari halaman ini yaitu tampilan data yang sudah dilakukan praproses
data pada kolom data, parameter masukan untuk proses clustering metode FCM
terdapat pada kolom Parameter FCM dan kolom hasil untuk menampilkan hasil
clustering. Tampilan halaman Fuzzy C-Means ditunjukkan pada Gambar 4.6
berikut.
Gambar 4.6 Antarmuka Halaman Fuzzy C-Means
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
Nilai-nilai yang ditampilkan pada kolom parameter FCM, merupakan nilai
default ketika halaman ini ditampilkan. Pengguna dapat merubah nilai-nilai
parameter tersebut dengan menggeser tombol slider, dan nilainya akan
ditampilkan pada textfield yang berada di bawah tombol slider.
Pemberian nilai default pada halaman ini dimaksudkan agar jika pengguna
lupa memasukkan nilai-nilai parameter FCM pada aplikasi maka nilai-nilai default
tersebut yang digunakan sebagai parameter untuk proses clustering.
Pengguna dapat melakukan proses clustering dengan menekan tombol
“Proses”, yang kemudian hasilnya akan ditampilkan pada kolom hasil. Tampilan
hasil clustering seperti ditunjukkan pada Gambar 4.7 berikut.
Gambar 4.7 Antarmuka Halaman Fuzzy C-Means (Clustering)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
Pengguna juga dapat melakukan operasi simpan hasil clustering, seperti
yang ditampilkan pada kolom hasil kedalam bentuk dokumen berekstensi .xls,.txt
atau .doc.
4.1.5 Implementasi Halaman Plot Clustering
Halaman ini digunakan untuk menampilkan grafik plot setelah proses
clustering selesai dilakukan. Tampilan grafik plot cluster ditunjukkan pada
Gambar 4.8 sebagai berikut.
Gambar 4.8 Antarmuka Halaman Plot Clustering
4.1.6 Implementasi Halaman Bantuan
Halaman bantuan adalah halaman yang akan ditampilkan ketika pengguna
memilih menu petunjuk pada halaman praproses data. Halaman ini berisi
informasi mengenai aplikasi dan petunjuk penggunaan aplikasi.
Tampilan halaman bantuan ditunjukkan pada Gambar 4.9 sebagai berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
Gambar 4.9 Antarmuka Halaman Bantuan
4.2 Implementasi Kelas
Pada bagian ini terdapat beberapa listing program dari kelas-kelas utama
yang digunakan dalam sistem ini. Method-method yang ditampilkan dari setiap
kelas hanya method yang memuat fungsi utama sistem yang berkaitan dengan
algoritma Fuzzy C-Means.
4.2.1 Implementasi Kelas MenuAwal
Method-method penting yang ada dalam kelas MenuAwal antara lain :
method btnMasukActionPerformed() dan method run(). Penjelasannya sebagai
berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
Method btnMasukActionPerformed() berisi perintah untuk menjalankan
frame PraprosesGUI jika tombol btnMasuk ditekan. Sedangkan method run()
berisi perintah untuk menjalankan tampilan dialog MenuAwal.
4.2.2 Implementasi Kelas PraprosesGUI
Method-method penting yang ada dalam kelas PraprosesGUI antara lain :
method pilihBerkas(), method distribusiAtribut(), method hapusatribut(), method
method pilihXLS(), pilihCSV() dan cekAtribut(). Penjelasannya sebagai berikut.
Method pilihBerkas() berisi perintah untuk mengarahkan pengguna ke
dialog pilihan berkas yang dijalankan oleh kelas JFileChooser. Setelah pengguna
private void pilihBerkas(){
JFileChooser chooser = new JFileChooser();
int returnVal = chooser.showOpenDialog(null);
if (returnVal == JFileChooser.APPROVE_OPTION) {
String nama_file = chooser.getSelectedFile().getPath();
String[] potong = nama_file.split("\\.");
if (potong[1].equals("xls")) { //FILE EXCEL
pilihXLS(chooser, nama_file);
} else if (potong[1].equals("csv")) { //FILE CSV
pilihCSV(chooser, nama_file);
} else {
JOptionPane.showMessageDialog(null, "File yang dipilih
harus berformat .xls atau .csv");
}
}
}
btnMasukActionPerformed(java.awt.event.ActionEvent evt) {
this.dispose();
PraprosesGUI pg = new PraprosesGUI();
pg.setLocationRelativeTo(null);
pg.setVisible(true);
pg.setExtendedState(pg.MAXIMIZED_BOTH);
}
public void run() {
MenuAwal dialog = new MenuAwal(new javax.swing.JFrame(),
true);
dialog.addWindowListener(new
java.awt.event.WindowAdapter() {
public void windowClosing(java.awt.event.WindowEvent e) {
System.exit(0);
}
});
dialog.setVisible(true);
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
memasukkan berkas data, maka nama berkas beserta lokasi penyimpanannya akan
disimpan dalam variable nama_file.
Untuk dapat membaca isi berkas, diperlukan perintah untuk mendeteksi
ekstensi berkas. Jika berkas berekstensi .xls maka method pilihXLS() akan
dijalankan, sedangkan jika berkas berekstensi .csv maka method pilihCSV() akan
dijalankan, namun jika tidak keduanya maka pesan kesalahan akan ditampilkan ke
layar.
Method hapusAtribut() merupakan method yang digunakan untuk
menghapus atribut yang tidak diperlukan pada preproses data input. Algoritma
proses hapus atribut sesuai sintak pada method hapusAtribut() sebagai berikut.
1. Buat objek berupa ArrayList untuk menyimpan data nama-nama atribut
yang telah dipilih untuk dihapus.
private void hapusAtribut() {
List<String> hapus_atribut = new ArrayList<String>();
for (int i = 0; i < ctm.getRowCount(); i++) {
if (ctm.getValueAt(i, 1).equals(true)) {
hapus_atribut.add(ctm.getValueAt(i, 0).toString());
}}
ctm.removeRow();
TableModel model = tabelPraproses.getModel();
int column = model.getColumnCount();
int row = model.getRowCount();
Vector columnNames = new Vector();
Vector data = new Vector();
for (int i = 0; i < ctm.getRowCount(); i++) {
if (!cekAtribut(ctm.getValueAt(i, 0).toString(),
hapus_atribut)) {
columnNames.addElement(ctm.getValueAt(i, 0));
}}
for (int i = 0; i < row; i++) {
Vector rows = new Vector();
for (int j = 0; j < column; j++) {
if (cekAtribut2(model.getColumnName(j).toString(),
columnNames)) {
rows.addElement(model.getValueAt(i, j));
}
}
data.addElement(rows);
}
DefaultTableModel new_model = new
DefaultTableModel(data, columnNames);
tabelPraproses.setModel(new_model);
ctm.removeRow();
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
2. Untuk setiap baris tabel hapus atribut, ambil nama atribut dan tambahkan
ke ArrayList.
3. Hapus baris dari tabel hapus Atribut yang telah dipilih .
4. Buat objek vector baru nama kolom, kolom dan baris untuk menyimpan
data kolom dan baris dari tabel hapus atribut.
5. Buat tabel model baru dari vector – vector hasil poin 3, dan set tabel
praproses dengan model baru tersebut.
4.2.3 Implementasi Kelas Distribusi Atribut
Method-method penting yang ada dalam kelas Distribusi Atribut antara
lain: method daftarAtribut() dan pilihAtribut(). Penjelasannya sebagai berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
Method daftarAtribut() digunakan untuk memberi isi pada komponen
komponen combo box pilihan atribut yang ingin dilihat distribusinya yang berasal
dari paramenter method List daftarAtribut.
Sedangkan method pilihAtribut() digunakan untuk menampilkan isi tabel
ditribusi atribut. Algoritma proses distribusi atribut sesuai sintak pada method
pilihAtribut() sebagai berikut.
1. Ambil nilai String dari combobox pilih atribut.
2. Buat objek berupa ArrayList untuk menyimpan data record dari atribut.
3. Filter record baris isi atribut dengan membuat List menjadi HashSet
private void daftarAtribut(List<String> daftarAtribut, JTable
tabel) {
model = tabel;
for (int i = 0; i < daftarAtribut.size(); i++) {
comboAtribut.addItem(daftarAtribut.get(i).toString());
}
}
private void pilihAtribut() {
String pilihAtribut =
comboAtribut.getSelectedItem().toString();
String[] columnName = new String[2];
String[][] data = null;
List<String> listData = new ArrayList<String>();
for (int i = 1; i < model.getColumnCount(); i++) {
if
(pilihAtribut.equalsIgnoreCase(model.getColumnName(i).toString(
))) {
columnName[0] = model.getColumnName(i).toString();
columnName[1] = "Jumlah";
for (int j = 0; j < model.getRowCount(); j++) {
listData.add(model.getValueAt(j, i).toString());
}
HashSet hashSet = new HashSet(listData);
listData.clear();
listData = new ArrayList(hashSet);
data = new String[listData.size()][2];
for (int k = 0; k < listData.size(); k++) {
for (int l = 0; l < model.getRowCount(); l++) {
if (listData.get(k).toString().
equalsIgnoreCase(model.getValueAt(l,
i).toString())) {
setCount(count + 1); }}
data[k][0] = listData.get(k).toString();
data[k][1] = String.valueOf(getCount());
setCount(0); } } }
DefaultTableModel d = new DefaultTableModel(data,
columnName);
tabelDistribusi.setModel(d); }
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
4. Counter isi dari record dari ArrayList untukmenegtahui banyak record.
5. Buat array bertipe String untuk menyimpan data hasil poin 3 dan 4.
Buat tabel model baru dan isi dengan array dari poin 5 untuk menampilkan
isi tabel distribusi.
4.2.4 Implementasi Kelas Fuzzy C-Means
Kelas Fuzzy C-Means merupakan kelas utama pada sistem ini. Kelas ini
berisi sintak-sintak algoritma Fuzzy C-Means yang dibagi menjadi 7 methods,
antara lain: method konstruktor FuzzyCMeans(), method matriksAwal(), method
hitungPusatKlaster(), method fObjektif(), matriksUBaru(), method getMaxValue()
dan method tampilHasil(). Penjelasannya sebagai berikut.
Method kontsruktor adalah method yang akan dijalankan bersamaan
dengan dipanggilnya kelas FuzzyCMeans. Parameter yang melekat pada method
konstruktor, kemudian digunakan oleh method lain sebagai variabel maupun
objek dalam proses clustering. Sedangkan method-method utama untuk proses
clustering, dapat dilihat pada sintaks berikut.
public class FuzzyCMeans {
……..
//fungsi konstruktor dengan parameter k,w,dan input
public FuzzyCMeans(int k, int w, double[][] input) {
this.k = k; this.w = w;
this.input = input;
//ambil nilai baris dan kolom dari var input
baris = input.length; kolom = input[0].length;
//inisialisasi var objektif sebanyak baris data input
objektif = new double[baris];
}
//fungsi untuk menghitung pusat klaster
public double[][] hitungPusatKlaster(){
double[] jumU = new double[k];
double[][] hitungUW = new double[baris][k];
for (int i=0;i<baris;i++){
for (int j=0;j<k;j++){
hitungUW[i][j]=Math.pow(matriksU[i][j],w);
//var jumU untuk menyimpan jumlah dari var
hitungUW
jumU[j] += hitungUW[i][j];
}
}
System.out.println("");
//var df untuk format penulisan dua angka dibelakang
koma
df = new DecimalFormat("###.###");
// for (int i=0;i<baris;i++){
// for (int j=0;j<k;j++){
//
System.out.print(df.format(hitungUW[i][j])+"\t");
// }
// System.out.println("");
// }
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
//fungsi untuk membuat matriks keanggotaan di awal secara acak
public double[][] matriksAwal(){
//barisnya sebanyak data input dan kolomnya sebanyak jumlah
klaster
matriksU = new double[baris][k];
Random generator = new Random();
//membuat random nilai dengan nilai desimal (1
dibelakang koma)
for (int i=0;i<baris;i++){
for (int j=0;j<k;j++){
matriksU[i][j] =
Math.round(generator.nextDouble()*100.0)/100.0;
}
}
//cetak matrik keanggotaan
System.out.println("Matrik U awal : ");
for (int i=0;i<baris;i++){
for (int j=0;j<k;j++){
System.out.print(matriksU[i][j] +"\t");
}
System.out.println("");
}
return matriksU;
}
//fungsi untuk menghitung pusat klaster
public double[][] hitungPusatKlaster(){
double[] jumU = new double[k];
double[][] hitungUW = new double[baris][k];
for (int i=0;i<baris;i++){
for (int j=0;j<k;j++){
//var hitung menyimpan pemangkatan matriks
keanggotaan dengan pembobot w
hitungUW[i][j]=Math.pow(matriksU[i][j],w);
//var jumU untuk menyimpan jumlah dari var
hitungUW
jumU[j] += hitungUW[i][j];
}
}
System.out.println("");
//instansiasi var v untuk menyimpan pusat klaster
v = new double[k][kolom];
double[][] sem = new double[k][kolom];
for (int i=0; i<baris;i++){ //panjang baris matrik input
for (int j=0; j<k;j++){ //panjang kolom matrik
keanggotaan
for(int l=0;l<kolom;l++){ //panjang kolom matrik
input
//var sem digunakan untuk menyimpan sementara jumlah
perhitungan (Uik^w) * (Xij), excel baris 30
sem[j][l] += (hitungUW[i][j]*input[i][l]);
}
//System.out.println();
}
//System.out.println();
for (int j=0; j<k;j++){ //panjang baris matrik
input
for(int l=0;l<kolom;l++){ //panjang kolom
matrik keanggotaan
//pusat klasternya, excel baris 39
v[j][l] = sem[j][l]/jumU[j];
//System.out.print(v[j][l]+" ");
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
…
//cetak pusat klaster
System.out.println("Pusat Kluster = ");
for (int i=0;i<k;i++){
for (int j=0;j<kolom;j++){
System.out.print(df.format(v[i][j])+"\t");
}
System.out.println();
}
System.out.println();
return v;
}
//fungsi menghitung fungsi objektif
public double fObjektif(){
totalP = new double[baris][v.length];
double[][] semP = new double[baris][v.length];
double Pbaru = 0;
System.out.println("Fungsi Objektif = ");
for (int i=0;i<baris;i++){
for (int j=0;j<v.length;j++){
for (int l=0;l<v[0].length;l++){
//var totalP menyimpan jumlah (Xij-Vkj)^2,
excel baris 52
totalP[i][j] += Math.pow((input[i][l]-
v[j][l]),2);
}
//var semP untuk meyimpan hasil perkalian
(Uik^w * P)
semP[i][j] = totalP[i][j] *
Math.pow(matriksU[i][j], w);
objektif[i] += semP[i][j];
//System.out.print(semP[i][j]+"\t");
}
//var Pbaru untuk menyimban fungsi objektif baru
Pbaru += objektif[i];
//System.out.println("");
}
System.out.println(Pbaru);
System.out.println();
return Pbaru;
}
//fungsi untuk membuat matriks keanggotaan baru
public double[][] matriksUBaru(){
double pemangkat = -1/(w-1);
double[] jum = new double[baris] ;
double[][] UBaru = new double[baris][k];
df = new DecimalFormat("###.###");
System.out.println("Matriks U Baru = ");
for (int i=0;i<baris;i++){
for (int j=0;j<k;j++){
//var jum untuk menyimpan jumlah matriks keanggotaan yg
dipangkatkan
jum[i] += Math.pow(totalP[i][j], pemangkat);
//System.out.print(Math.pow(totalP[i][j],
pemangkat)+"\t");
}
for (int j=0;j<k;j++){
//var Ubaru menyimpan nilai untuk matriks
keanggotaan yang baru hasil pembagian totalP/jum, excel baris
61 (pink)
UBaru[i][j] = Math.pow(totalP[i][j],
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
jum[i] += Math.pow(totalP[i][j], pemangkat);
}
for (int j=0;j<k;j++){
//var Ubaru menyimpan nilai untuk matriks keanggotaan yang baru
hasil pembagian totalP/jum
UBaru[i][j] = Math.pow(totalP[i][j],
pemangkat)/jum[i];
System.out.print(df.format(UBaru[i][j])+"\t");
}
System.out.println("");
}
matriksU = UBaru;
return matriksU;
}
// mendapatkan nilai maksimal dari data array
public Data getMaxValue(Data[] listdata){
Data maxValue = listdata[0];
for(int i=1;i < listdata.length;i++){
if(listdata[i].getIsi() > maxValue.getIsi()){
maxValue = listdata[i];
}
}
return maxValue;
}
//menampilkan hasil ke teks area/console sistem
public Tabel[] tampilHasil(double[][] hasil,Tabel[] t){
System.out.println("Hasil Klaster data sebagai berikut : ");
Data [] listdata = new Data[hasil[0].length];
Integer [] klaster = new Integer[hasil.length];
Data akhir;
for (int i=0;i<hasil.length;i++){
for (int j=0;j<hasil[0].length;j++){
Data sem = new Data();
sem.setPosisi(j+1);
sem.setIsi(hasil[i][j]);
listdata[j]=sem;
}
akhir = getMaxValue(listdata);
klaster[i]=akhir.getPosisi();
}
for(int i=0;i<klaster.length;i++){
t[i].setPosisi(""+klaster[i]);
}
ArrayList<Integer> b = new ArrayList<>();
Collections.addAll(b, klaster);
for(int i=1;i<=hasil[0].length;i++){
System.out.println("Banyak Klaster "+i+" =
"+Collections.frequency(b,i));
System.out.println("Isi Klaster "+i+" = ");
if(Collections.frequency(b,i)!=0){
for (Tabel t1 : t) {
if (Integer.parseInt(t1.getPosisi()) == i)
{
System.out.println("Data ke-
"+t1.getNo()+"\t"+t1.getNama());
}
}
System.out.println("");
}else{
System.out.println("-");
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
4.2.5 Implementasi Kelas ScatterAdd
Kelas ScatterAdd merupakan kelas yang digunakan untuk menampilkan
grafik plot clustering. Method – method yang ada didalam kelas ini antara lain:
method konstruktor ScatterAdd(), method createPanel() dan method createData().
Method konstruktor berisi parameter jdudl dan objek dari kelas Tabel
berisi hasil clustering. Sedangkan method createData() berfungsi untuk
mengkonversikan objek array data menjadi list, kemudian dijadikan parameter
untuk kelas pembentuk grafik tipe XY (XYSeriresCollection).
Method createPanel() berfungsi sebagai eksekutor grafik plot clustering
yang memanggil kelas JFreeChart, sebagai kelas pembentuk grafik plot. Return
value dari method ini kemudian dikirimkan ke kelas ChartPanel untuk
ditampilkan ke pengguna dalam bentuk grafik.
public class ScatterAdd extends JFrame {
private XYSeries added = new XYSeries("Data Sekolah"); private String title; public ScatterAdd(String s,Tabel[] ctk) { this.title=s; final ChartPanel chartPanel = createPanel(); this.add(chartPanel, BorderLayout.CENTER); for (Tabel ctk1 : ctk) {
added.add(Integer.parseInt(ctk1.getNo()),
Integer.parseInt(ctk1.getPosisi())); }
} private ChartPanel createPanel() { JFreeChart jfreechart = ChartFactory.createScatterPlot( title, "", "Klaster", createData(), PlotOrientation.VERTICAL, true, true, false); XYPlot xyPlot = (XYPlot) jfreechart.getPlot(); xyPlot.setDomainCrosshairVisible(true); xyPlot.setRangeCrosshairVisible(true); XYItemRenderer renderer = xyPlot.getRenderer(); renderer.setSeriesPaint(0, Color.blue); NumberAxis domain = (NumberAxis)
yPlot.getDomainAxis(); domain.setVerticalTickLabels(true); NumberAxis range = (NumberAxis) xyPlot.getRangeAxis(); range.setTickUnit(new NumberTickUnit(1));
return new ChartPanel(jfreechart); }
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
4.2.6 Implementasi Kelas tProgram
Kelas tProgram merupakan kelas yang mengimplementasikan halaman
bantuan. Kelas ini berisi komponen utama objek dari kelas URL yang berisi
alamat lokasi berkas bantuan bernama aplikasi.rtf, JTextPanel sebagai wadah
(container) tempat berkas bantuan ditampilkan. Berikut sintak yang ada dalam
kelas tProgram.
4.3 Pengujian Sistem
Pengujian terhadap sistem ini meliputi metode pengujian, yaitu pengujian
blackbox dan pengujian implementasi algoritma Fuzzy C-Means (FCM).
Pengujian blackbox adalah pengujian perangkat lunak dari aspek
fungsional dengan tidak memperhatikan struktur internal dari perangkat lunak
yang diuji. Pengetahuan khusus mengenai struktur internal dan pemrograman
pada umumnya tidak diperlukan dalam pengujian blackbox. Pengujian blackbox
dilakukan untuk mengetahui apakah sebuah perangkat lunak sudah berfungsi
sesuai dengan yang diharapkan pengguna.
public tProgram() {
try{
url=getClass().getResource("/Komponen/aplikasi.rtf");
initComponents();
jTextPane1.setEditable(false);
jTextPane1.setPage(url);
} catch (IOException ex) {
System.out.println("File tidak dapat dibuka");
}
}
…
private XYDataset createData() { XYSeriesCollection xySeriesCollection = new XYSeriesCollection(); xySeriesCollection.addSeries(added); return xySeriesCollection; } }
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
Pengujian implementasi algoritma FCM dilakukan dengan
membandingkan hasil cluster(klaster) yang diperoleh melalui sistem dengan hasil
cluster melalui perhitungan manual dan metode FCM dari tools Matlab.
4.3.1 Pengujian Blackbox
Berikut tabel 4.2 yang menunjukkan hasil pengujian blackbox pada sistem.
Berikut tabel 4.2 yang menunjukkan hasil pengujian blackbox pada aplikasi.
Tabel 4.2 Tabel Hasil Pengujian Blackbox
No Interface Keterangan
1 Halaman Awal Sudah berjalan dengan baik, tombol masuk berjalan
sesuai dengan fungsinya.
2 Halaman
Praproses
Sudah berjalan dengan baik, pesan kesalahan sudah
muncul jika berkas yang dimasukkan bukan berekstensi
.xls atau .csv.
Tombol Distribusi Atribut, Hapus Atribut dan Klastering
sudah berjalan sesuai fungsinya.
Tabel Hapus atribut dapat diberikan pilihan dan ketika
proses hapus atribut dipilih, tabel data dan tabel hapus
sudah berubah sesuai atribut yang tidak dihapus.
3
Halaman
Distribusi
Atribut
Sudah berjalan dengan baik menampilkan pilihan atribut
yang ingin dilihat distribusinya pada combobox.
Tabel distribusi atribut sudah secara benar menampilkan
banyaknya record dari atribut.
4 Halaman Fuzzy
C-Means
Sudah berjalan dengan baik, menampilkan data dari
halaman praproses.
Pemberian parameter FCM dapat berjalan dengan baik
dengan menggeser slider dan nilai ditampilkan pada field
parameter
Proses klastering berjalan dengan baik, dan hasil klaster
ditampilkan di teksarea klaster.
Tombol proses,ulangi,plot dan kembali sudah berjalan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
sesuai fungsinya.
Tombol simpan sudah dapat menyimpan dalam
format.xls, .txt dan .doc
5 Halaman Plot
Klaster
Sudah memunculkan plot xy klaster data dan klaster,
namun belum dapat memberikan pembedaan warna data
klaster sesuai klaster.
6 Halaman
Bantuan
Sudah bekerja baik, muncul teks petunjuk pemakaian
aplikasi.
4.3.2 Pengujian Validitas Implementasi Algoritm FCM
Pengujian validitas implementasi algoritma FCM dimaksudkan untuk
mengetahui apakah algoritma FCM sudah diimplementasikan secara benar sesuai
dengan dasar teori algoritma FCM. Pengujian dilakukan dengan cara melakuakan
perbandingan hasil uji sistem dengan perhitungan manual dan uji pada tools
Matlab.Data uji menggunakan data yang sudah siap untuk diproses clustering.
Data uji yang digunakan secara manual dan sistem yakni dengan banyak
data sejumlah 3 atribut dan 10 record, dicuplik dari data ujian nasional sekolah
menengah atas di DIY. Berikut contoh input data yang digunakan sebagai bahan
uji ditunjukkan pada tabel 4.3. Sedangkan data untuk uji matlab menggunakan
data IPA tahun 2011, cuplikan terdapat pada lampiran.
Tabel 4.3 Tabel Data Uji Algoritma FCM
No Nama Sekolah ING MAT BIO
1 SMA NEGERI 3 YOGYAKARTA 8.73 8.40 8.20
2 SMA NEGERI 1 BANTUL 8.14 8.32 8.31
3 SMA PATRIA BANTUL 4.00 2.63 4.53
4 SMA SANTO THOMAS
YOGYAKARTA 5.80 3.75 4.38
5 SMA NEGERI 1 SLEMAN 8.29 7.85 7.81
6 SMA NEGERI 1 YOGYAKARTA 8.47 8.14 7.95
7 SMA MUHAMMADIYAH SEWON 5.58 3.52 4.52
8 SMA PEMBANGUNAN 2
KARANGMOJO 4.55 2.96 4.66
9 SMA MUHAMMADIYAH WATES 3.93 2.97 4.69
10 SMA PEMBANGUNAN 3 PONJONG 5.19 3.52 5.05
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
4.3.2.1 Pengujian Algoritma FCM pada Sistem
Hasil pengujian pada sistem setelah data input dilakukan praproses data,
kemudian diberikan input parameter FCM berupa: jumlah klaster = 2, pemangkat
= 2, maksimum iterasi = 100 dan toleransi error = 0.001. Hasil pengujian
ditunjukkan pada Gambar 4.10 sebagai berikut.
Gambar 4.10 Pengujian Algoritma FCM pada Sistem
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
Cuplikan hasil pengujian pada Gambar 4.10 sebagai berikut.
Iterasi ke-6 :
==============================
Pusat Kluster =
4.836 3.222 4.641
8.406 8.176 8.066
Fungsi Objektif = 4.8558649415505215
Matriks U Baru =
0.003 0.997
0.003 0.997
0.983 0.017
0.969 0.031
0.004 0.996
0 1
0.985 0.015
0.997 0.003
0.985 0.015
0.991 0.009
Banyak Data = 10
************************************
Hasil Klaster data sebagai berikut :
Banyak Klaster 1 = 6
Isi Klaster 1 =
Data ke-3 SMA PATRIA BANTUL
Data ke-4 SMA SANTO THOMAS YOGYAKARTA
Data ke-7 SMA MUHAMMADIYAH SEWON
Data ke-8 SMA PEMBANGUNAN 2 KARANGMOJO
Data ke-9 SMA MUHAMMADIYAH WATES
Data ke-10 SMA PEMBANGUNAN 3 PONJONG
Banyak Klaster 2 = 4
Isi Klaster 2 =
Data ke-1 SMA NEGERI 3 YOGYAKARTA
Data ke-2 SMA NEGERI 1 BANTUL
Data ke-5 SMA NEGERI 1 SLEMAN
Data ke-6 SMA NEGERI 1 YOGYAKARTA
************************************
Banyak Iterasi = 6
Error Fungsi Obyektif = 4.981817772353736E-5
Waktu Klastering = 0.208 detik
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
Cuplikan hasil pengujian pada sistem menunjukkan bahwa sistem dapat
mengelompokkan data uji secara baik setelah 6 (enam) iterasi, dengan kesalahan
fungsi obyektif sebesar 4.981817772353736E-5 dengan waktu 0.208 detik.
Perbandingan implementasi algoritma FCM dilakukan dengan
membandingkan implementasi dan uji algoritma FCM pada perhitungan manual
dengan tools Microsoft Excel dan uji metode FCM pada tools Matlab dengan data
uji yang sama dengan pengujian algoritma FCM pada sistem.
4.3.2.2 Pengujian Perbandingan Hasil Secara Manual dan Sistem
Data uji yang digunakan merupakan data sampel nilai ujian nasional dan
niali sekolah pada tahun 2011. Pengujian pada data uji dimaksudkan untuk
mengetahui apakah sistem dapat mengelompokkan sekolah sesuai dengan data uji.
Tabel data uji secara manual dan sistem ditunjukkan pada tabel 4.4 dan data uji
pada matlab dan sistem terdapat pada lampiran, sebagai berikut.
Tabel 4.4 Sampel Data Uji Secara Manual dan Sistem
Data Variabel
ING MAT BIO
SMA NEGERI 3 YOGYAKARTA 8.73 8.40 8.20
SMA NEGERI 1 BANTUL 8.14 8.32 8.31
SMA PATRIA BANTUL 4.00 2.63 4.53
SMA SANTO THOMAS YOGYAKARTA 5.80 3.75 4.38
SMA NEGERI 1 SLEMAN 8.29 7.85 7.81
SMA NEGERI 1 YOGYAKARTA 8.47 8.14 7.95
SMA MUHAMMADIYAH SEWON 5.58 3.52 4.52
SMA PEMBANGUNAN 2 KARANGMOJO 4.55 2.96 4.66
SMA MUHAMMADIYAH WATES 3.93 2.97 4.69
SMA PEMBANGUNAN 3 PONJONG 5.19 3.52 5.05
Setelah dilakukan pengujian pada sistem dibandingkan dengan manual
didapatkan hasil perbandingan hasil implementasi algoritma FCM seperti
ditunjukkan pada tabel 4.5 dan table 4.6 sebagai berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
Tabel 4.5 Uji Perbandingan Algoritma FCM Secara Manual dan Sistem
No Uji Sistem M. Excel
1 Jumlah data 10 10
2 Jumlah Iterasi 4 6
3 Fungsi Obyektif 4.855 4.86
4 Error FObyektif 0.008328 0.00
5 Member klaster 1 6 6
6 Member klaster 2 4 4
Tabel 4.6 Hasil uji perbandingan member percluster secara manual dan
sistem
Sistem Manual
klaster
1
SMA PATRIA BANTUL
SMA SANTO THOMAS YOGYAKARTA
SMA MUHAMMADIYAH SEWON
SMA PEMBANGUNAN 2 KARANGMOJO
SMA MUHAMMADIYAH WATES
SMA PEMBANGUNAN 3 PONJONG
SMA PATRIA BANTUL
SMA SANTO THOMAS YOGYAKARTA
SMA MUHAMMADIYAH SEWON
SMA PEMBANGUNAN 2 KARANGMOJO
SMA MUHAMMADIYAH WATES
SMA PEMBANGUNAN 3 PONJONG
Klaster
2
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 1 BANTUL
SMA NEGERI 1 SLEMAN
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 1 BANTUL
SMA NEGERI 1 SLEMAN
SMA NEGERI 1 YOGYAKARTA
Kesimpulan hasil perbandingan metode FCM secara manual dan dengan
sistem yaitu bahwa sistem telah dapat mengimplementasikan algoritma FCM
dengan baik, dengan menghasilkan jumlah dan data member klaster yang sama
dengan perhitungan manual .
Untuk melihat lebih lanjut hasil perhitungan manual lihat pada Lampiran
Hasil manual.
4.3.2.3 Pengujian Perubahan Nilai Galat(e) dan Maksimal Iterasi(i)
Pengujian terhadap sistem implementasi Algoritma Fuzzy C-Means dapat
dilakukan dengan mengubah nilai Galat ( e) dan maksimal Iterasi (i) . Berikut
beberapa hasil uji clustering .
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
Di uji dengan data IPA 2013 dengan,
a. Jumlah data uji 137 sekolah,
b. Jumlah data atribut 12 terdiri dari nilai UN B.ind, B.ing,
Matematika, Fisika, Kimia, Biologi dan NS atribut B.ind, B.ing,
Matematika, Fisika, Kimia, Biologi
c. Jumlah klaster (k) = 3 , pemangkatam pembobot (w)= 2
Menghasilkan perbedaan hasil setelah melakukan 5 kali percobaan,seperti
dibawah ini :
Tabel 4.7 Uji perubahan nilai Galat ( e) dan maksimal Iterasi (i)
Maksimal iterasi(i) 5 9 13 21 100 G A
L ( e ) A T
0.1 5 5 5 5 5
0.01 5 5 5 5 5
0.001 5 5 5 5 4
0.0001 5 5 5 5 3
0.00001 5 5 4 2 1
Dari hasil percobaan diatas, dapat disimpulkan bahwa,
a. jika semakin kecil Galat(e) yaitu 0.00001 dan maksimal iterasi semakin
besar yaitu 100 maka akan menghasilkan 1 macam hasil dari proses
clustering, dengan kata lain menghasilkan jumlah anggota cluster yang
konsistensinya tinggi dan hasilnya akan semakin serupa dengan hasil yang
diuji dengan matlab
b. jika semakin besar Galat(e) yaitu 0.1 dan maksimal iterasi semakin kecil
yaitu 5 maka akan menghasilkan 5 bahkan lebih macam hasil dari proses
clustering bila melakukan uji lebih dari 5, dengan kata lain menghasilkan
jumlah anggota cluster yang konsistensinya rendah dan hasilnya akan
semakin kurang akurat dalam mengelompokkan data sehingga hasil uji
dari sistem akan berdeda dari hasil uji matlab.
Untuk melihat lebih lanjut rincian hasil percobaan, lihat pada Lampiran uji
perubahan nilai Galat dan maksimal Iterasi(i)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
4.3.2.4 Pengujian Perbandingan Hasil Sistem dengan Matlab
Kemudian dilakukan pengujian pada sistem dibandingkan matlab dengan
file yang berisi data nilai 6 mata pelajaran ujian nasional dan 6 mata pelajaran
ujian sekolah IPA tahun 2011 dengan maksimal iterasi 100 dan nilai Galat =
0,00001 , maka hasil perbandingan hasil implementasi algoritma FCM seperti
ditunjukkan pada tabel 4.8 dan tabel 4.9 sebagai berikut.
Tabel 4.8 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem
No Uji Sistem Matlab
1 Jumlah data 134 134
2 Jumlah Iterasi 18 29
3 Jumlah Member
klaster 1 54 54
4 Jumlah Member
klaster 2 32 32
5 Jumlah Member
klaster 3 48 48
Tabel 4.9 Hasil uji perbandingan member percluster nilai ujian nasional, nilai
sekolah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
Kemudian dilakukan pengujian pada sistem dibandingkan matlab dengan
data nilai 6 mata pelajaran ujian nasional IPA tahun 2011 dengan maksimal iterasi
100 dan nilai Galat = 0,00001, maka hasil perbandingan hasil implementasi
algoritma FCM seperti ditunjukkan pada tabel 4.10 dan tabel 4.11 sebagai berikut
Tabel 4.10 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem
No Uji Sistem Matlab
1 Jumlah data 134 134
2 Jumlah Iterasi 22 21
3 Jumlah Member
klaster 1 50 50
4 Jumlah Member
klaster 2 54 54
5 Jumlah Member
klaster 3 30 30
Tabel 4.11 Hasil uji perbandingan member percluster nilai ujian nasional
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
Kemudian dilakukan pengujian pada sistem dibandingkan dengan matlab
dengan file yang berisi data nilai 6 mata pelajaran ujian sekolah IPA tahun 2011
dengan maksimal iterasi 100 dan nilai Galat = 0,00001, maka hasil perbandingan
hasil implementasi algoritma FCM seperti ditunjukkan pada tabel 4.12 dan tabel
4.13 sebagai berikut
Tabel 4.12 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem
No Uji Sistem Matlab
1 Jumlah data 134 134
2 Jumlah Iterasi 20 27
3 Jumlah Member
klaster 1 48 48
4 Jumlah Member
klaster 2 59 59
5 Jumlah Member
klaster 3 27 27
Tabel 4.13 Hasil uji perbandingan member percluster nilai ujian sekolah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
Kesimpulan hasil perbandingan algoritma FCM matlab dengan sistem
yaitu bahwa sistem telah dapat mengimplementasikan metode FCM dengan valid,
dengan menghasilkan jumlah dan data member klaster yang sama dengan
perhitungan matlab.
Untuk melihat lebih lanjut screenshot gambar hasil percobaan, lihat pada
Lampiran gambar screenshot hasil uji matlab dan sistem.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
Tabel 4.14 Hasil uji perbandingan hasil jumlah member percluster
Hasil table 4.7 Hasil table 4.9 Hasil table 4.11
Jumlah Anggota
Cluster 1 54 50 48
Jumlah Anggota
Cluster 2 32 54 59
Jumlah Anggota
Cluster 3 48 30 27
Pada table 4.14 dapat dilihat perbandingan hasil dari ketiga percobaan
tersebut, yang menghasilkan jumlah anggota member cluster yang berbeda
perclusternya dalam 3 data inputan uji coba yang berbeda. Hal ini dikarenakan
inputan data yang diuji memiliki nilai yang berbeda-beda. Untuk melihat rincian
perbandingan hasil anggota percluster dari table 4.9, 4.11, dan 4.13 dapat dilihat
pada lampiran table perbandingan detail table 4.14.
4.4 Kelebihan dan Kekurangan Sistem
Sistem yang dibangun ini memiliki kelebihan dan kekurangan. Berikut
adalah kelebihan dan kekurangan dari sistem.
4.4.2 Kelebihan Sistem
1. Sistem dapat membaca input data yang berasal dari berkas dengan
format .xls dan .csv .
2. Sistem dapat melakukan seleksi atribut atau kolom terhadap data yang
diinputkan oleh pengguna.
3. Sistem dapat menyimpan hasil cluster (klaster) ke dalam berkas
dengan format .xls,.txt dan .doc.
4. Sistem dapat menampilkan grafik plot klaster.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
4.4.3 Kekurangan Sistem
1. Sistem tidak dapat membaca input data berupa file dengan format
selain .xls dan .csv .
2. Sistem tidak dapat menampilkan data statistik selain distribusi data
(mean,median,range, maksimum, minimum) pada data input.
3. Sistem tidak dapat melakukan seleksi dan hapus baris terhadap data
yang diinputkan pengguna.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Kesimpulan yang diperoleh sebagai hasil penyelesaian tugas akhir ini
adalah:
1. Implementasi algoritma Fuzzy C-Means untuk pengelompokan Sekolah
Menengah Atas di DIY berdasarkan nilai Ujian Nasional dan nilai sekolah
telah berhasil dibangun dan dapat digunakan untuk pengelompokan
Sekolah Menengah Atas di DIY .
2. Metode Clustering dengan algoritma Fuzzy C-Means terbukti dapat
mengelompokkan data sekolah dengan valid.
5.2 Saran
Berdasarkan hasil analisis pada tugas akhir ini, penulis memberikan saran
untuk perbaikan dan pengembangan program lebih lanjut antara lain:
1. Program yang dibangun ini belum bisa menerima masukan selain berkas
berformat .xls, .csv. Sistem ini bisa dilengkapi dengan tambahan pembaca
data dari format lain contohnya seperti .doc.
2. Program dapat menampilkan data statistik selain distribusi atribut yaitu
mean, median, range, maksimumdan minimum.
3. Program dapat menampilkan grafik selain hasil klaster yaitu grafik iterasi,
grafik fungsi objektif dan grafik error fungsi objektif.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
DAFTAR PUSTAKA
Asih, Wening Tyas. 2008. Aplikasi Program Pengelompokan Penduduk
Berdasarkan Kemampuan Ekonomi untuk Daerah Miskin dengan Fuzzy C-
Means.Universitas Sanata Dharma.
Dunham, Margareth H. 2003. Data Mining Introductory and Advanced
Topics.New Jersey: Prentice Hall.
Ernawati, Susanto. 2009. Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy
Clustering dan Partition Coefficient and Exponential Separation Index .
Universitas Atma Jaya.
Hadi HY. 2005. Pembagian Kelas Kuliah Mahasiswa Menggunakan Algoritma
Pengklasteran Fuzzy. Universitas Diponegoro.
Hair et al. 1998. Multivariate Data Analysis, Fifth Edition.Upper Saddle River :
New Jersy.
Han, Jiawei & Kamber, Micheline. 2006. Data Mining: Concepts and Techniques
2nd ed. San Francisco, CA: Morgan Kaufmann Publishers.
Kantardzic, M. 2003. Data Mining Concepts Models, Methods, and Algorithms.
New Jersey: IEEE.
Kusumadewi, S. dan Purnomo, H. 2010. Aplikasi Logika Fuzzy untuk Pendukung
Keputusan edisi 2. Yogyakarta: Graha Ilmu.
Luthfi , Emha Taufiq. 2007. Fuzzy C-Means Untuk Clustering Performance
Mengajar Dosen. STMIK AMIKOM .
Roger S. Pressman, 2002. Rekayasa Perangkat Lunak Pendekatan Praktisi (Buku
Satu): ANDI Yogyakarta.
Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis.
Yogyakarta:GrahaIlmu.
Sudjana, Nana. 2001. Penilaian hasil proses belajar mengajar. Bandung: Remaja
Rosdakarya.
Wahyuni et al. 2009. Penggunaan Cluster-Based Samplinguntuk Penggalian
Kaidah Asosiasi Multi Obyektif. Institut Teknologi Nasional Malang
Yehuda, Aditya Nur Santoso. 2012. Penerapan Algoritma Fuzzy C-means untuk
Clustering Objek Wisata.Universitas Kristen Satya Wacana.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79
LAMPIRAN
LAMPIRAN TABEL RINGKASAN USECASE
Tabel Deskripsi Use Case
Nomor Nama Use Case Deskripsi Aktor
Use Case
FC-001 Input data file .xls, Use case ini menggambarkan proses Pengguna .csv input data, dalam bentuk file .xls,
.csv yang akan digunakan untuk proses
clustering
FC-002 Seleksi atribut Use case ini menggambarkan proses seleksi atribut dari data yang Pengguna
diinputkan, sehingga atribut yang
Tidak diperlukan dapat dihapus.
FC-003 Distribusi atribut Use case ini menggambarkan proses Pengguna distribusi atribut dari data yang
diinputkan
FC-004 Proses clustering Use case ini menggambarkan proses Pengguna
input k,w,i,e Clustering dalam data yang telah
diinputkan
FC-005 Lihat grafik plot Use case ini menggambarkan grafik Pengguna
Hasil dari proses clustering
FC-006 Simpan hasil Use case ini menggambarkan proses Pengguna proses clustering simpan hasil pencarian clustering ke
dalam file .xls, .txt atau .doc
FC-007 Lihat bantuan Use case ini untuk melihat petujuk Pengguna bagaimana cara kerja dari sistem ini
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
LAMPIRAN DIAGRAM AKTIFITAS (ACTIVITY DIAGRAM)
Diagram Aktivitas
1. Input data file .xls, .csv
Pengguna Sistem
Menekan tombol
pilih berkas
Menampilkan
JFileChooser
Memilih file .xls
atau .csv
Membaca data yang dipilih lalu menampilkannya pada tabel data beserta jumlahnya dan daftar nama atribut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
2. Proses clustering
Pengguna Sistem
Menekan tombol
Klastering
Menampilkan halaman
FCMGUI dan menampilkan
data yang telah dipilih inputan
pada tabel
Mengeset jumlah k,w,I,e
Menekan tombol Proses
Menampilkan hasi clustering
pada teks area FCMGUI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
82
3. Simpan Hasil Clustering
4. Seleksi Atribut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
83
5. Distribusi Atribut
Pengguna Sistem
6. Melihat plot
Menekan tombol
Distribusi Atribut
Menampilkan
DistribusiAtributGUI
Memilih nama atribut
dari daftar atribut
Menampilkan detail isi
atribut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
84
7. Melihat Bantuan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
85
LAMPIRAN DIAGRAM KONTEKS
Gambar Diagram Konteks
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
86
LAMPIRAN UJI PERUBAHAN NILAI GALAT(e), DAN MAKSIMAL
ITERASI (i)
Sebagian Rincian percobaan pada tabel 4.7
Dilakukan percobaan 5 kali uji,
Percobaan 1, dengan Galat (e) = 0,1
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 28 34 38 35 29
Cluster 2 36 45 43 44 47
Cluster 3 63 58 56 58 61
Percobaan 2, dengan Galat (e) = 0,1
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 27 38 28 34 28
Cluster 2 37 43 50 45 49
Cluster 3 73 56 59 58 50
Percobaan 3, dengan Galat (e) = 0,1
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 46 35 33 28 31
Cluster 2 43 44 45 36 45
Cluster 3 48 58 59 63 61
Percobaan 4, dengan Galat (e) = 0,1
i=5 i=9 i=13 i=21 i=100
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
87
Jumlah anggota cluster
Cluster 1 48 30 27 32 31
Cluster 2 45 46 51 45 46
Cluster 3 44 61 59 60 60
Percobaan 5, dengan Galat (e) = 0,1
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 5 32 31 29 29
Cluster 2 57 45 46 47 47
Cluster 3 75 60 60 61 61
Dari hasil sebagian uji diatas, dapat disimpulkan dalam 5 kali percobaan
dengn galat (e )= 0,1 dan maksimal iterasi ()= 100 menghasilkan konsisten yang
rendah terhadap jumlah anggota perclusternya. Dengan kata lain jumlah anggota
perclusternya mengalami perubahan dari setiap kali uji.
Lalu merubah Galat (e) = 0,00001
Percobaan 1, dengan Galat (e) = 0,00001
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 45 27 29 29 29
Cluster 2 45 52 48 46 47
Cluster 3 47 58 60 62 61
Percobaan 2, dengan Galat (e) = 0,00001
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
88
Cluster 1 47 43 29 29 29
Cluster 2 42 44 47 47 47
Cluster 3 48 50 61 61 61
Percobaan 3, dengan Galat (e) = 0,00001
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 44 34 29 29 29
Cluster 2 46 44 47 46 47
Cluster 3 47 59 59 62 61
Percobaan 4, dengan Galat (e) = 0,00001
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 35 27 30 29 29
Cluster 2 49 34 46 46 47
Cluster 3 53 76 61 62 61
Percobaan 5, dengan Galat (e) = 0,00001
i=5 i=9 i=13 i=21 i=100
Jumlah anggota cluster
Cluster 1 29 35 29 29 29
Cluster 2 43 44 47 46 47
Cluster 3 65 58 61 62 61
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
89
Dari hasil sebagian uji diatas, dapat disimpulkan dalam 5 kali percobaan
dengan galat (e)= 0,00001 dan maksimal iterasi ()= 100 menghasilkan konsisten
yang tinggi terhadap jumlah anggota perclusternya. Dengan kata lain jumlah
danggota perclusternya tidak mengalami perbedaan dari setiap kali uji.
Sehingga akan lebih baik jika menggunakan nilai Galat (e) yang kecil dan
maksimal iterasi (i) yang besar dalam melakukan proses clustering karena
menghasilkan konsistensi data anggota percluster yang tinggi dan hasilnya akan
semakin serupa dengan yang dihasilkan uji matlab.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
Lampiran Data Uji Matlab
Data uji yang digunakan untuk matlab dan sistem yakni dengan banyak data
sejumlah 12 atribut dan 134 record,berikut cuplikan data yang ada pada file Data
IPA 2011.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
91
LAMPIRAN GAMBAR SCREENSHOT UJI MATLAB
a. Screenshot Hasil Data uji Nilai Ujian Nasional dan Sekolah IPA tahun 2011
1. Hasil iteration count
2. Hasil pusat cluster iterasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
92
3. Hasil obj_fcn
4. Hasil Matriks U Baru iterasi terakhir
Keterangan Gambar Matriks U Baru iterasi terakhir yaitu
Data ke-1,2 ,3,.. masuk ke cluster 1, karena nilai matriks keanggotaannya
lebih besar di cluster 1 dari pada cluster 2 dan cluster 3
Data ke-…,128,129 ,130,dan 134 masuk ke cluster 3, karena nilai matriks
keanggotaannya lebih besar di cluster 3 dari pada cluster 1 dan cluster 2
Data ke-…,132,dan 133 masuk ke cluster 2, karena nilai matriks
keanggotaannya lebih besar di cluster 3 dari pada cluster 1 dan cluster 3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
93
b. Screenshot Hasil Data uji Nilai Ujian Nasional IPA tahun 2011
1. Hasil iteration count
2. Hasil pusat cluster
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
94
3. Hasil obj_fcn
4. Hasil Matriks U Baru iterasi terakhir
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
95
c. Screenshot Hasil Data uji Nilai Sekolah IPA tahun 2011
1. Hasil iteration count
2. Hasil pusat cluster
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
96
3. Hasil obj_fcn
4. Hasil Matriks U Baru iterasi terakhir
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
97
LAMPIRAN GAMBAR SCREENSHOT HASIL UJI SISTEM
a. Dengan data Nilai Ujian Nasional dan Sekolah IPA tahun 2011
,cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir .
…..
…..
….
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
98
…
b. Dengan data Nilai Ujian Nasional IPA tahun 2011
,cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir
.
…
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
99
…
…
…
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
100
c. Dengan data Nilai Sekolah IPA tahun 2011
, cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir
…
…
…
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
101
…
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
102
Detail gambar screenshot perbandingan hasil percobaan table 4.8 member per
cluster hasil uji matlab dengan sistem
…
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
103
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
104
LAMPIRAN PERBANDINGAN DETAIL TABEL 4.14
Perbandingan hasil dari tabel 4.9, 4.11 dan 4.13
Kode
Sekolah
Data sekolah Hasil
NS
Hasil
UN
Hasil
UN
US
01-001
01-002
01-003
01-004
01-005
01-006
01-007
01-008
01-009
01-010
01-011
01-012
01-015
01-017
01-018
01-019
01-020
01-021
01-022
01-025
01-026
01-029
01-030
01-032
01-033
01-039
01-042
01-043
01-044
01-045
01-046
01-047
01-050
01-051
01-053
SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA
SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA
SMA SULTAN AGUNG YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA
SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA
SMA MUHAMMADIYAH 6 YOGYAKARTA
SMA MUHAMMADIYAH 5 YOGYAKARTA
SMA GAJAH MADA YOGYAKARTA
SMA PIRI 2 YOGYAKARTA
SMA PANGUDI LUHUR YOGYAKARTA
SMA NEGERI 5 YOGYAKARTA
SMA NEGERI 8 YOGYAKARTA
SMA MUHAMMADIYAH 4 YOGYAKARTA
SMA MUHAMMADIYAH 2 YOGYAKARTA
SMA 'INSTITUT INDONESIA' 1 YOGYAKARTA
SMA SANTO THOMAS YOGYAKARTA
SMA K SANG TIMUR YOGYAKARTA
SMA MARSUDI LUHUR YOGYAKARTA
SMA PIRI 1 YOGYAKARTA
SMA TAMAN MADYA IBU PAWIYATAN YOGYAKARTA
3
1
2
1
1
3
2
2
2
1
2
2
2
3
2
2
1
2
2
1
1
1
1
2
1
3
2
1
2
2
1
2
3
2
2
2
2
2
2
2
2
1
2
1
3
1
1
2
2
2
1
1
2
1
3
1
1
2
3
1
2
2
1
1
1
3
1
3
1
1
1
1
1
1
1
1
3
1
3
2
3
3
1
1
1
3
2
1
3
2
3
3
1
2
3
1
1
3
3
3
2
3
2
3
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
105
01-054
01-055
01-056
01-058
02-001
02-002
02-003
02-004
02-005
02-006
02-008
02-009
02-012
02-014
02-016
02-020
02-021
02-023
02-025
02-026
02-027
02-029
02-030
02-031
02-034
02-035
02-038
02-044
02-045
02-046
02-047
02-049
02-050
03-001
03-002
03-003
03-004
03-005
03-006
03-009
03-012
03-013
03-014
03-015
SMA BERBUDI YOGYAKARTA
SMA STELLA DUCE 2 YOGYAKARTA
SMA SANTA MARIA YOGYAKARTA
SMA ISLAM TERPADU ABU BAKAR
SMA NEGERI 2 BANTUL
SMA NEGERI 1 BANTUL
SMA NEGERI 1 KASIHAN
SMA NEGERI 3 BANTUL
SMA NEGERI 1 SEDAYU
SMA NEGERI 1 SANDEN
SMA MUHAMMADIYAH BANTUL
SMA NEGERI 1 PAJANGAN
SMA MUHAMMADIYAH KASIHAN
SMA NEGERI 1 SRANDAKAN
SMA STELLA DUCE BANTUL
SMA PANGUDI LUHUR SEDAYU
SMA NEGERI 1 BAMBANGLIPURO
SMA NEGERI 1 SEWON
SMA NEGERI 1 IMOGIRI
SMA NEGERI 1 JETIS
SMA NEGERI 1 PLERET
SMA NEGERI 1 BANGUNTAPAN
SMA MUHAMMADIYAH SEWON
SMA MUHAMMADIYAH IMOGIRI
SMA MUHAMMADIYAH PIYUNGAN
SMA BOPKRI BANGUNTAPAN
SMA NEGERI 1 PIYUNGAN
SMA PATRIA BANTUL
SMA NEGERI 1 PUNDONG
SMA UII BANGUNTAPAN
SMA NEGERI 2 BANGUNTAPAN
SMA NEGERI 1 DLINGO
SMA NEGERI 1 KRETEK
SMA NEGERI 1 WATES
SMA NEGERI 2 WATES
SMA NEGERI 1 TEMON
SMA NEGERI 1 PENGASIH
SMA NEGERI 1 KOKAP
SMA MUHAMMADIYAH WATES
SMA MA'ARIF WATES
SMA NEGERI 1 SENTOLO
SMA NEGERI 1 LENDAH
SMA NEGERI 1 SAMIGALUH
SMA NEGERI 1 KALIBAWANG
1
3
3
2
1
2
3
1
1
1
1
2
1
1
2
2
1
2
1
1
2
2
1
1
1
2
1
1
1
1
2
2
1
3
3
2
3
3
1
1
3
2
2
2
3
1
1
1
2
2
2
2
1
2
2
2
3
2
2
1
2
2
1
2
2
2
3
3
1
1
1
3
2
2
2
1
1
2
2
2
2
2
3
3
2
1
3
2
2
3
3
3
1
1
1
1
3
1
1
1
2
1
1
3
1
1
3
1
1
1
2
2
2
3
3
2
1
1
1
3
3
1
1
1
1
1
2
2
1
3
2
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
106
03-016
03-017
03-024
04-001
04-002
04-003
04-004
04-005
04-008
04-009
04-010
04-011
04-013
04-014
04-016
04-017
04-023
04-024
04-025
04-026
04-028
04-037
04-038
04-039
04-040
04-044
04-046
04-048
04-053
04-054
04-055
04-057
04-060
04-067
04-068
04-069
04-071
04-076
04-077
05-001
05-002
05-003
05-004
05-005
SMA NEGERI 1 GIRIMULYO
SMA MUHAMMADIYAH GALUR
SMA NEGERI 1 GALUR
SMA NEGERI 1 PRAMBANAN
SMA NEGERI 1 DEPOK
SMA NEGERI 1 KALASAN
SMA KOLESE DE BRITTO
SMA ANGKASA
SMA MANDALA BHAKTI
SMA GAMA YOGYAKARTA
SMA KOLOMBO SLEMAN
SMA IMANUEL KALASAN
SMA INSTITUT INDONESIA SLEMAN
SMA MUHAMMADIYAH 1 PRAMBANAN
SMA ISLAM 1 PRAMBANAN
SMA MUHAMMADIYAH KALASAN
SMA NEGERI 1 GODEAN
SMA NEGERI 1SEYEGAN
SMA NEGERI 1 GAMPING
SMA NEGERI 1 MINGGIR
SMA ISLAM 1 GAMPING
SMA NEGERI 1 SLEMAN
SMA NEGERI 2 SLEMAN
SMA NEGERI 1 TURI
SMA NEGERI 1 MLATI
SMA MUHAMMADIYAH MLATI
SMA SANTO MIKAEL SLEMAN
SMA MUHAMMADIYAH 1 SLEMAN
SMA NEGERI 1 PAKEM
SMA NEGERI 1 NGAGLIK
SMA NEGERI 2 NGAGLIK
SMA MUHAMMADIYAH PAKEM
SMA ISLAM 3 SLEMAN
SMA NEGERI 1 TEMPEL
SMA NEGERI 1 NGEMPLAK
SMA NEGERI 1 CANGKRINGAN
SMA PROKLAMASI '45
SMA IT BINA UMAT
SMA BUDI MULIA DUA
SMA 2 WONOSARI
SMA 1 WONOSARI
SMA 2 PLAYEN
SMA 1 PLAYEN
SMA 1 PATUK
2
3
1
2
3
3
3
1
2
2
1
1
1
1
2
1
3
1
3
2
1
3
2
3
3
3
1
2
3
2
1
2
1
2
2
3
1
2
3
2
3
2
2
2
2
3
2
2
2
2
2
3
3
1
1
3
3
3
3
3
2
1
2
2
1
2
1
1
2
1
1
3
2
1
2
3
3
1
1
1
1
1
1
2
2
2
3
1
1
2
1
1
1
1
1
2
2
3
3
2
2
2
2
2
1
3
1
1
3
1
3
3
1
3
3
2
1
3
1
2
2
3
3
3
3
3
3
1
1
1
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
107
05-006
05-007
05-009
05-012
05-020
05-021
05-022
05-024
05-025
05-027
05-034
SMA 1 PANGGANG
SMA 1 TANJUNGSARI
SMA MUHAMMADIYAH WONOSARI
SMA DOMINIKUS WONOSARI
SMA 1 KARANGMOJO
SMA 1 SEMIN
SMA 1 RONGKOP
SMA PEMBANGUNAN 2 KARANGMOJO
SMA PEMBANGUNAN 3 PONJONG
SMA IKIP VETERAN III TAMBAKROMO
SMA 1 SEMANU
2
2
2
2
2
1
2
2
2
1
2
1
3
3
1
1
1
1
3
3
3
1
3
2
2
3
3
3
3
2
2
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
108
LAMPIRAN UJI MANUAL
1. Permasalahan
Data
Variabel
ING MAT BIO
x1 8.73 8.40 8.20 SMA NEGERI 3 YOGYAKARTA
x2 8.14 8.32 8.31 SMA NEGERI 1 BANTUL
x3 4.00 2.63 4.53 SMA PATRIA BANTUL
x4 5.80 3.75 4.38 SMA SANTO THOMAS YOGYAKARTA
x5 8.29 7.85 7.81 SMA NEGERI 1 SLEMAN
x6 8.47 8.14 7.95 SMA NEGERI 1 YOGYAKARTA
x7 5.58 3.52 4.52 SMA MUHAMMADIYAH SEWON
x8 4.55 2.96 4.66 SMA PEMBANGUNAN 2 KARANGMOJO
x9 3.93 2.97 4.69 SMA MUHAMMADIYAH WATES
x10 5.19 3.52 5.05 SMA PEMBANGUNAN 3 PONJONG
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
109
2. Menentukan besarnya kluster (k >= 2), pemangkat/pembobot (w>1), maks iterasi (max = 5),
galat (e= 0.01)
k = 2
fungsi objektif(P0) = 0, dan iterasi awal = 1
w = 2
max = 50
e = 0.001
P0 = 0
iter = 1
Iterasi 1
Langkah 3. Bentuk matriks partisi awal keanggotaan (Uik) yg nilai awalnya acak, i= banyak data, k = banyak kluster(antara0
-1)
Uik i k1 k2
1 0.21 0.36
2 0.66 0.18
3 0.01 0.22
4 0.38 0.76
5 0.16 0.81
6 0.12 0.94
7 0.09 0.62
8 0.46 0.51
9 0.11 0.8
10 0.81 0.13
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
110
Langkah 4. Hitung pusat kluster
i Uik Xij
1 2 1 2 3 Ui1^w Ui2^w
(Ui1^w) *
(Xi1)
(Ui1^w)
* (Xi2)
(Ui1^w)
* (Xi3)
(Ui2^w) *
(Xi1)
(Ui2^w)
* (Xi2)
(Ui2^w)
* (Xi3)
1 0.21 0.36 8.73 8.40 8.20 0.0441 0.1296 0.38 0.37 0.36 1.13 1.09 1.06
2 0.66 0.18 8.14 8.32 8.31 0.4356 0.0324 3.55 3.62 3.62 0.26 0.27 0.27
3 0.01 0.22 4.00 2.63 4.53 0.0001 0.0484 0.00 0.00 0.00 0.19 0.13 0.22
4 0.38 0.76 5.80 3.75 4.38 0.1444 0.5776 0.84 0.54 0.63 3.35 2.17 2.53
5 0.16 0.81 8.29 7.85 7.81 0.0256 0.6561 0.21 0.20 0.20 5.44 5.15 5.12
6 0.12 0.94 8.47 8.14 7.95 0.0144 0.8836 0.12 0.12 0.11 7.48 7.19 7.02
7 0.09 0.62 5.58 3.52 4.52 0.0081 0.3844 0.05 0.03 0.04 2.14 1.35 1.74
8 0.46 0.51 4.55 2.96 4.66 0.2116 0.2601 0.96 0.63 0.99 1.18 0.77 1.21
9 0.11 0.8 3.93 2.97 4.69 0.0121 0.64 0.05 0.04 0.06 2.52 1.90 3.00
10 0.81 0.13 5.19 3.52 5.05 0.6561 0.0169 3.41 2.31 3.31 0.09 0.06 0.09
1.5521 3.6291 9.563579 7.854828 9.321519 23.793303 20.077661 22.266364
Pusat Kluster
Vkj 1 2 3
1 6.162 5.061 6.006 2 6.556 5.532 6.136
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
111
Langkah 5. Hitung fungsi objektif baru (Pt)
i kluster 1 kluster 2 kluster 1 kluster 2
P1
(Xi1-
V11)^2
(Xi2-
V12)^2
(Xi3-
V13)^2 Total 1
(Xi1-
V21)^2
(Xi2-
V22)^2
(Xi3-
V23)^2
Total
2 Ui1^w P Ui2^w P
1 6.596 11.150 4.815 22.561 4.73 8.22 4.26 17.21 0.0441 0.995 0.1296 2.230 3.23
2 3.914 10.623 5.310 19.846 2.51 7.77 4.73 15.01 0.4356 8.645 0.0324 0.486 9.13
3 4.673 5.909 2.178 12.759 6.53 8.42 2.58 17.54 0.0001 0.001 0.0484 0.849 0.85
4 0.131 1.718 2.643 4.492 0.57 3.18 3.08 6.83 0.1444 0.649 0.5776 3.945 4.59
5 4.530 7.780 3.255 15.565 3.01 5.37 2.80 11.18 0.0256 0.398 0.6561 7.336 7.73
6 5.328 9.482 3.780 18.590 3.66 6.80 3.29 13.75 0.0144 0.268 0.8836 12.153 12.42
7 0.338 2.374 2.207 4.920 0.95 4.05 2.61 7.61 0.0081 0.040 0.3844 2.926 2.97
8 2.598 4.413 1.811 8.822 4.03 6.62 2.18 12.82 0.2116 1.867 0.2601 3.334 5.20
9 4.980 4.371 1.731 11.083 6.90 6.57 2.09 15.55 0.0121 0.134 0.64 9.954 10.09
10 0.944 2.374 0.913 4.232 1.87 4.05 1.18 7.09 0.6561 2.776 0.0169 0.120 2.90
59.11
Langkah 6. Perbaharui nilai U
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
112
(Xi1-
Vk1)^2
(Xi2-
Vk2)^2
(Xi3-
Vk3)^2
Total
1^-1
(Xi1-
Vk1)^2
(Xi2-
Vk2)^2
(Xi3-
Vk3)^2
Total
2 Total
Ui1 =
Tot1/Tot
Ui2 =
Tot2/Tot
1 6.60 11.15 4.81 0.04 4.73 8.22 4.26 0.06 0.10 0.433 0.567
2 3.91 10.62 5.31 0.05 2.51 7.77 4.73 0.07 0.12 0.431 0.569
3 4.67 5.91 2.18 0.08 6.53 8.42 2.58 0.06 0.14 0.579 0.421
4 0.13 1.72 2.64 0.22 0.57 3.18 3.08 0.15 0.37 0.603 0.397
5 4.53 7.78 3.26 0.06 3.01 5.37 2.80 0.09 0.15 0.418 0.582
6 5.33 9.48 3.78 0.05 3.66 6.80 3.29 0.07 0.13 0.425 0.575
7 0.34 2.37 2.21 0.20 0.95 4.05 2.61 0.13 0.33 0.607 0.393
8 2.60 4.41 1.81 0.11 4.03 6.62 2.18 0.08 0.19 0.592 0.408
9 4.98 4.37 1.73 0.09 6.90 6.57 2.09 0.06 0.15 0.584 0.416
10 0.94 2.37 0.91 0.24 1.87 4.05 1.18 0.14 0.38 0.626 0.374
Langkah 7. Cek Kondisi berhenti
Apakah iter >= max ? 1 >= 100 salah
Apakah | P1-P0| < galat ? 59.11 > 0.01 salah
Maka, Ulangi langkah ke 4
Iterasi 2
Langkah 4 Hitung pusat kluster
.
.
.
Ulangi hingga ,
Iterasi 6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
113
Langkah 4 Hitung pusat kluster
i Uik Xij
1 2 1 2 3 Ui1^w Ui2^w
(Ui1^w) *
(Xi1)
(Ui1^w)
* (Xi2)
(Ui1^w)
* (Xi3) (Ui2^w)
* (Xi1)
(Ui2^w)
* (Xi2)
(Ui2^w)
* (Xi3)
1 0.003 0.997 8.73 8.40 8.20 0.000 0.994 0.00 0.00 0.00 8.67 8.35 8.15
2 0.003 0.997 8.14 8.32 8.31 0.000 0.994 0.00 0.00 0.00 8.09 8.27 8.26
3 0.983 0.017 4.00 2.63 4.53 0.967 0.000 3.87 2.54 4.38 0.00 0.00 0.00
4 0.969 0.031 5.80 3.75 4.38 0.939 0.001 5.45 3.52 4.11 0.01 0.00 0.00
5 0.004 0.996 8.29 7.85 7.81 0.000 0.992 0.00 0.00 0.00 8.22 7.78 7.74
6 0.000 1.000 8.47 8.14 7.95 0.000 0.999 0.00 0.00 0.00 8.46 8.13 7.94
7 0.985 0.015 5.58 3.52 4.52 0.970 0.000 5.41 3.41 4.38 0.00 0.00 0.00
8 0.997 0.003 4.55 2.96 4.66 0.994 0.000 4.52 2.94 4.63 0.00 0.00 0.00
9 0.985 0.015 3.93 2.97 4.69 0.970 0.000 3.81 2.88 4.55 0.00 0.00 0.00
10 0.991 0.009 5.19 3.52 5.05 0.982 0.000 5.10 3.46 4.96 0.00 0.00 0.00
5.822 3.980 28.16 18.76 27.02 33.46 32.54 32.10
Pusat Kluster
Vkj 1 2 3
1 4.836 3.222 4.641
2 8.406 8.176 8.066
Langkah 5. Hitung fungsi objektif baru (Pt)
i kluster 1 kluster 2 kluster 1 kluster 2 P3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
114
(Xi1-
Vk1)^2
(Xi2-
Vk2)^2
(Xi3-
Vk3)^2 Total 1
(Xi1-
Vk1)^2
(Xi2-
Vk2)^2
(Xi3-
Vk3)^2
Total
2 Uik^w P Uik^w P
1 15.159 26.811 12.669 54.639 0.10 0.05 0.02 0.17 0.000 0.001 0.994 0.172 0.17
2 10.913 25.989 13.464 50.366 0.07 0.02 0.06 0.15 0.000 0.000 0.994 0.150 0.15
3 0.700 0.351 0.012 1.062 19.41 30.75 12.50 62.67 0.967 1.027 0.000 0.017 1.04
4 0.928 0.279 0.068 1.275 6.79 19.59 13.59 39.96 0.939 1.198 0.001 0.038 1.24
5 11.927 21.418 10.044 43.389 0.01 0.11 0.07 0.18 0.000 0.001 0.992 0.183 0.18
6 13.202 24.186 10.951 48.340 0.00 0.00 0.01 0.02 0.000 0.000 0.999 0.019 0.02
7 0.553 0.089 0.015 0.656 7.99 21.67 12.57 42.23 0.970 0.636 0.000 0.010 0.65
8 0.082 0.069 0.000 0.151 14.87 27.20 11.60 53.67 0.994 0.150 0.000 0.000 0.15
9 0.822 0.064 0.002 0.888 20.04 27.10 11.40 58.53 0.970 0.861 0.000 0.013 0.87
10 0.125 0.089 0.168 0.381 10.34 21.67 9.10 41.11 0.982 0.374 0.000 0.003 0.38
4.86
Langkah 6. Perbaharui nilai U
(Xi1-
Vk1)^2
(Xi2-
Vk2)^2
(Xi3-
Vk3)^2 Total 1
(Xi1-
Vk1)^2
(Xi2-
Vk2)^2
(Xi3-
Vk3)^2 Total 2 Total
Ui1 =
Tot1/Tot
Ui2 =
Tot2/Tot
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
115
1 15.16 26.81 12.67 0.02 0.10 0.05 0.02 5.77 5.79 0.003 0.997
2 10.91 25.99 13.46 0.02 0.07 0.02 0.06 6.61 6.63 0.003 0.997
3 0.70 0.35 0.01 0.94 19.41 30.75 12.50 0.02 0.96 0.983 0.017
4 0.93 0.28 0.07 0.78 6.79 19.59 13.59 0.03 0.81 0.969 0.031
5 11.93 21.42 10.04 0.02 0.01 0.11 0.07 5.41 5.43 0.004 0.996
6 13.20 24.19 10.95 0.02 0.00 0.00 0.01 53.29 53.32 0.000 1.000
7 0.55 0.09 0.01 1.52 7.99 21.67 12.57 0.02 1.55 0.985 0.015
8 0.08 0.07 0.00 6.62 14.87 27.20 11.60 0.02 6.64 0.997 0.003
9 0.82 0.06 0.00 1.13 20.04 27.10 11.40 0.02 1.14 0.985 0.015
10 0.12 0.09 0.17 2.62 10.34 21.67 9.10 0.02 2.65 0.991 0.009
Langkah 7. Cek Kondisi berhenti
Apakah iter >= max ? 6 >= 100 salah
Apakah | P6-P5| < galat ? 0.00 < 0.001 benar
Karena sudah memenuhi salah satu syarat yakni | P6-P5| < galat ,maka yang digunakan pusat kluster iterasi ke-6
Pusat Kluster
Vkj 1 2 3
1 4.8365 3.2220 4.6407
2 8.4062 8.1755 8.0659
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
116
Matriks U
U1 U2
0.003 0.997
0.003 0.997
0.983 0.017
0.969 0.031
0.004 0.996
0.000 1.000
0.985 0.015
0.997 0.003
0.985 0.015
0.991 0.009
Pengelompokan data setelah iterasi ke-5
Data Klaster
1 2
1
SMA NEGERI 3 YOGYAKARTA
2
SMA NEGERI 1 BANTUL
3 SMA PATRIA BANTUL
4 SMA SANTO THOMAS YOGYAKARTA
5
SMA NEGERI 1 SLEMAN
6
SMA NEGERI 1 YOGYAKARTA
7 SMA MUHAMMADIYAH SEWON
8 SMA PEMBANGUNAN 2 KARANGMOJO
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
117
9 SMA MUHAMMADIYAH WATES
10 SMA PEMBANGUNAN 3 PONJONG
Jadi member pada klaster 1 adalah
1. SMA PATRIA BANTUL,
2. SMA SANTO THOMAS YOGYAKARTA
3. SMA MUHAMMADIYAH SEWON
4. SMA PEMBANGUNAN 2 KARANGMOJO
5. SMA MUHAMMADIYAH WATES
6. SMA PEMBANGUNAN 3 PONJONG
Dan member pada klaster 2 adalah
1. SMA NEGERI 3 YOGYAKARTA
2. SMA NEGERI 1 BANTUL
3. SMA NEGERI 1 SLEMAN
4. SMA NEGERI 1 YOGYAKARTA
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
118
Lampiran Uji Pembahasan
Data yang digunakan dalam penelitian ini adalah data nilai Ujian Nasional dan Nilai Sekolah jurusan IPA tahun 2014. Data
berupa Nilal Ujian Nasional meliputi nilai Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi, serta Nilai Sekolah
meliputi nilai Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi. Kemudian dilakukan proses clustering dan
diperoleh hasil yaitu nilai fungsi obyektif selama iterasi, pusat cluster atau center serta derajat keanggotaan lulusan untuk setiap
cluster pada iterasi terakhir. Dalam penelitian ini, proses iterasinya berhenti pada iterasi ke-16 karena nilai |Pt - Pt-1|< ξ. Nilai fungsi
obyektif pada iterasi terakhir yang diperoleh adalah 229.56468745177847. Hasil dari clustering yang dilakukan dapat dilihat di
bawah ini
1. Nilai fungsi obyektif selama 16 iterasi dapat dilihat pada Tabel 1 di bawah ini:
Tabel 1. Nilai Fungsi Obyektif Selama 16
Iterasi Iterasi ke- Fungsi Obyektif
1 1155.5736314030255
2 415.13592847351043
3 396.01448828816535
4 335.9950949051618
5 278.9339644577249
6 254.11151626828388
7 239.70029181677043
8 233.37497040864258
9 231.13342998610136
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
119
10 230.25302077227119
.. …
16 229.56468745177847
2. Nilai pusat cluster atau center
Pada iterasi terakhir (iterasi ke-16), pusat cluster Vkj yang dihasilkan dengan k=1,2,3 dan j=1,2 adalah:
3. Derajat keanggotaan lulusan untuk sertiap cluster pada iterasi terakhir (iterasi ke-16)
Tabel 2. Derajat keanggota Pada Ketiga Cluster
Data
ke-
Derajat Keanggotaan (μ) SMA Setiap
Cluster Pada Iterasi Terakhir
μi1
μi2
μi3
1 0.05 0.108 0.842
2 0.024 0.068 0.909
3 0.012 0.031 0.957
4 0.027 0.066 0.906
7.152 4.619 3.673 3.623 3.698 4.717 8.811 8.757 8.74 8.751 8.722 8.741
7.831 5.651 4.94 4.732 4.907 5.951 8.397 8.359 8.331 8.308 8.318 8.339
8.313 7.05 6.986 6.62 6.436 7.433 8.376 8.39 8.297 8.318 8.339 8.344
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
120
5 0.045 0.191 0.763
6 0.022 0.06 0.918
7 0.069 0.316 0.614
8 0.277 0.675 0.048 . . .
.
.
.
.
.
.
.
.
.
141 0.428 0.514 0.059
Dari derajat keanggotaan lulusan pada iterasi terakhir dapat diperoleh informasi mengenai kecenderungan lulusan untuk masuk ke cluster mana.
Derajat keanggotaan terbesar menunjukkan bahwa kecenderungan tertinggi lulusan untuk masuk menjadi anggota cluster tersebut. Misalnya
untuk lulusan ke-1, dapat menjadi:
a. Anggota cluster pertama dengan derajat keanggotaan 0.05
b. Anggota cluster kedua dengan derajat keanggotaan 0.108
c. Anggota cluster ketiga dengan derajat keanggotaan 0.842
Derajat keanggotaan terbesarnya terletak di cluster ketiga, maka data ke -1 akan dimasukkan kedalam cluster ketiga. Hasil selengkapnya
pengelompokkan ke-141 SMA kedalam 3 cluster dapat dilihat pada di bawah ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
121
Tabel 3. Anggota Pada Ketiga Cluster
Cluster Beranggotakan SMA dengan data ke-
1 10, 11, 16, 17, 19, 20, 21, 22, 23, 28, 30, 31, 33, 34, 35, 36, 47, 49, 50, 51,
52, 62, 63, 64, 66, 67, 69, 72, 78, 79, 80, 86, 92, 93, 94, 95, 97, 98, 99,
100, 105, 110, 111, 112, 114, 117, 130, 131, 133, 137, 138, 139, 140
2 8, 9, 12, 25, 29, 32, 38, 40, 45, 46, 48, 53, 54, 55, 58, 60, 61, 65, 68, 70,
71, 76, 81, 82, 83, 84,8 5, 87, 88, 96, 102, 103, 104, 107,108,115,116,
118, 119, 120, 121, 122, 123, 126, 127, 128, 129, 132, 134, 135, 136, 141
3 1, 2, 3, 4, 5, 6, 7, 13, 14, 15, 18, 24, 26, 27, 37, 39, 41, 42, 43, 44, 56, 57,
59, 73, 74, 75, 77, 89, 90, 91, 101, 106, 109, 113, 124, 125
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
122
Cluster Jumlah Anggota
Bahasa indoUN Bahasa InggrisUN MatematikaUN FisikaUN KimiaUN BiologiUN
RATA-
RATA
MAX MIN
RATA-
RATA
MAX MIN
RATA-
RATA
MAX
MIN RATA-
RATA
MAX MIN RATA-
RATA
MAX MIN RATA-
RATA
MAX MIN
1 53 7.152
8.50 5.30
4.619
5.93 3.57
3.673
4.75
2.89 3.623
5.00 2.65 3.698
4.78 2.39 4.717
6.25 3.21
2 25 7.831
8.25 6.84
5.651
7.76 4.38
4.94 6.31
4.17 4.732
6.99 3.66 4.907
6.03 4.08 5.951
6.83 5.10
3 36 8.313
9.40 5.51
7.05 8.20 5.85
6.986
8.35
5.50 6.62 7.83 5.00 6.436
7.25 5.59 7.433
9.00 6.40
Bahasa indoUS Bahasa InggrisUS MatematikaUS FisikaUS KimiaUS BiologiUS
RATA-
RATA
MAX MIN
RATA-
RATA
MAX MIN
RATA-
RATA
MAX
MIN RATA-
RATA
MAX MIN RATA-
RATA
MAX MIN RATA-
RATA
MAX MIN
8.811
9.71 8.02
8.757
9.74 7.80
8.74 9.72
7.96 8.751
9.72 7.97 8.722
9.69 8.00 8.741
9.71 7.73
8.397
9.28 7.96
8.359
9.03 7.75
8.331
8.91
7.87 8.308
8.96 7.82 8.318
8.96 7.81 8.339
8.93 7.91
8.376
9.32 7.80
8.39 9.45 7.80
8.297
9.34
7.67 8.318
9.34 7.77 8.339
9.31 7.81 8.344
9.29 7.77
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
123
Dari hasil di atas dapat diperoleh:
a. Berdasarkan uji coba clustering yang dilakukan, pada data SMA di DIY pada tahun 2011 jurusan IPA diset dalam 3 cluster.
b. Dari hasil uji coba, ketiga cluster tersebut diketahui bahwa pada cluster 1 memiliki jumlah yang paling banyak dengan 53 sekolah
sedangkan cluster 2 dengan 52 sekolah dan cluster 3 dengan 36 sekolah.
c. Untuk cluster 1 memiliki criteria nilai yang rendah dibanding kedua cluster yang lain di bagian nilai UN dan memiliki nilai tinggi dibagian
nilai US, sedangkan cluster 2 memiliki criteria nilai yang sedang dibanding kedua cluster yang lain di bagian nilai UN dan memiliki nilai
rendah dibagian nilai US, dan cluster 3 memiliki criteria nilai yang tinggi dibanding kedua cluster yang lain di bagian nilai UN dan memiliki
nilai sedang dibagian nilai US.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI