PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · banyak kekurangan. Untuk itu, penulis...

IMPLEMENTASI ALGORITMA FUZZY C-MEANS UNTUK

PENGELOMPOKAN SEKOLAH MENENGAH ATAS

DI DIY BERDASARKAN NILAI UJIAN NASIONAL

DAN NILAI SEKOLAH

SKRIPSI

Diajukan Untuk Memenuhi salah Satu Syarat

Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika

Disusun Oleh :

Maria Riana Megawati

115314058

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2015

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJIPLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

ii

THE IMPLEMENTATION OF FUZZY C-MEANS ALGORITHM FOR

CLUSTERING SENIOR HIGH SCHOOL BASED ON THE VALUE OF

NATIONAL EXAM AND VALUE OF SCHOOL

A THESIS

Presented as Partial Fulfillment of the Requirements

To Obtain the Sarjana Komputer Degree

In Departement of Informatic Engineering

By :


115314058

INFORMATICS ENGINEERING STUDY

PROGRAM DEPARTMENT OF INFORMATICS

ENGINEERING FACULTY OF SCIENCE AND

TECHNOLOGY SANATA DHARMA UNIVERSITY

YOGYAKARTA

2015


iii

HALAMAN PERSETUJUAN


iv

HALAMAN PENGESAHAN


v

HALAMAN PERSEMBAHAN

“Success does not suddenly come to you. You have to go out and work hard to get it”

“Time is like a river. You cannot touch the same water twice, because the flow that has passed will never pass again.

Enjoy every moment of life…”

”When you keep saying you are busy, then you are never free. When you keep saying you have no time, then you will never have time.

When you keep saying that you will do it tomorrow, then your tomorrow will never come”

“Intelligence is not the determinant of success, but hard work is the real determinant of your success.”

“Do n’t be afraid to move, because the distance of 1000 miles starts by a single step.”

“Aku ini adalah hamba Tuhan; terjadilah padaku menurut perkataan-Mu”

(Luk 1:38)

Skripsi ini , penulis persembahkan untuk :

Kedua orangtua ku

Terimakasih atas semua doa, kasih saying, dukungan ,

kepercayaan, dan bantuannya selama ini.


vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi saya yang saya tulis ini

tidak memuat karya atau bagian karya orang lain, kecuali yang telah saya sebutkan

dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta , 31 Agustus 2015

Penulis,



vii

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :

Nama : Maria Riana Megawati

Nomor Mahasiswa : 115314058

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma karya ilmiah saya yang berjudul :

“IMPLEMENTASI ALGORITMA FUZZY C-MEANS UNTUK

PENGELOMPOKAN SEKOLAH MENENGAH ATAS DI DIY BERDASARKAN

NILAI UJIAN NASIONAL DAN NILAI SEKOLAH“

beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan

kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, me-

ngalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,

mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media

lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun

memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai

penulis.

Demikian pernyataan ini yang saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada tanggal : 31 Agustus 2015

Yang menyatakan,

(Maria Riana Megawati)


viii

ABSTRAK

Data mining merupakan penambangan atau penemuan informasi baru dengan

mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar . Salah satu

metode data mining yaitu clustering. Clustering adalah proses mengelompokkan

objek ke dalam suatu kelompok (cluster) sehingga objek memiliki kemiripan sangat

besar dengan objek lain yang berada pada cluster yang sama, tetapi memiliki

ketidakmiripan yang besar dengan objek yang berada pada cluster berbeda. Salah

satu algoritma clustering adalah Fuzzy C-Means (FCM). FCM adalah metode

clustering fuzzy dimana keberadaan tiap titik data dalam suatu cluster ditentukan oleh

derajat keanggotaan. Dengan metode ini, data akan dikelompokkan ke dalam cluster

yang berbeda sesuai persentase keanggotaannya di masing-masing klaster.

Pada tugas akhir ini akan diimplementasikan algoritma Fuzzy C-Means untuk

mengelompokkan data Sekolah Menengah Atas di DIY berdasarkan nilai Ujian

Nasional dan Nilai Sekolah. Hasil tugas akhir ini yaitu sebuah perangkat lunak yang

dapat digunakan sebagai alat bantu untuk pengelompokan Sekolah Menengah Atas

menggunakan algoritma Fuzzy C-Means . Pengujian terhadap sistem ini terdiri dari

pengujian blackbox, dan pengujian validitas implementasi algoritma Fuzzy C-Means.

Berdasarkan hasil pengujian blackbox yang dilakukan, disimpulkan bahwa

sistem pengelompokan ini dapat menghasilkan keluaran yang sesuai dengan yang

diharapkan pengguna. Berdasarkan hasil pengujian validitas implementasi algoritma

Fuzzy C-Means. yang dilakukan, disimpulkan bahwa Metode clustering algoritma

Fuzzy C-Means terbukti dapat mengelompokkan sekumpulan data bertipe numerik.

Kata kunci: Data mining, algoritma Fuzzy C-Means, Clustering.


ix

ABSTRACT

Data mining is mining procces or extracting information by getting pattern or

specific rules from large amounts of data . One of the data mining method is

clustering. Clustering is the process of grouping objects into a group (cluster) so that

the object has a very great similarity with other objects that are on the same cluster,

but has a great dissimilarity with objects that are in different clusters. One algorithm

of clustering is Fuzzy C-Means (FCM). FCM is a technique of fuzzy clustering in

which each data point in a cluster is determined by the degree of membership. With

this method, the data will be grouped into different clusters according to percentage

of membership in each cluster.

This thesis will implement Fuzzy C-Means algorithm was used to clustering

high school data based on the value of National Exam and School Exam. The results

of this thesis is a software that can be used as a tool to cluster high school data using

Fuzzy C-Means algorithm. The testing of this system consists of blackbox testing

and validity testing of Fuzzy C-Means algorithm implementation.

Based on blackbox testing, it can be concluded that the clustering system

could produce output as expected and handle any incorrect functions. Based on

validity testing of Fuzzy C-Means algorithm implementation, it can be concluded

that the clustering method Fuzzy C-Means algorithm, is able to classify the type of

numerical data set

Keywords : Data mining, Fuzzy C-Means algorithm, Clustering.


x

KATA PENGANTAR

Puji syukur kepada Tuhan Yesus Kristus, atas segala berkat dan karunia

sehingga penulis dapat menyelesaikan tugas akhir yang berjudul “Implementasi

Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Atas di

DIY Berdasarkan Nilai Ujian Nasional dan Nilai Sekolah”. Tugas akhir ini ditulis

sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik

Informatika, Falkutas Sains dan Teknologi Sanata Dharma.

Penulisan tugas akhir ini berjalan dengan baik dari awal hingga akhir karena

adanya dukungan doa, semangat dan motivasi yang diberikan oleh banyak pihak.

Untuk itu, penulis ingin mengucapkan terima kasih kepada:

1. Tuhan Yesus Kristus dan Bunda Maria yang selalu memberikan anugerah,

rahmat, kekuatan dan keberuntungan sehingga penulis dapat menyelesaikan

tugas akhir ini.

2. Kedua Orang Tua saya, Ir. Agustinus Sumasriyana M.Si dan Fransiska Wiwik

Suryani S.Pd atas doa, kasih sayang, perhatian,kepercayaaan, dukungan baik

moral maupun financial yang diberikan kepadaku.

3. Kakak ku tersayang, Catharina Andrian Shinta Dewi, dan saudara-saudarku

tersayang, Lintang Sari P, serta Sukma yang menemani dalam penyusunan

tugas akhir.

4. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc. selaku Dekan Fakultas

Sains dan Teknologi Universitas Sanata Dharma Yogyakarta sekaligus Dosen

Pembimbing yang telah dengan sabar membimbing dan memberikan

motivasi.

5. Ibu Dr. Anastasia Rita Widiarti selaku Ketua Program Studi Teknik

Informatika Falkutas Sains dan Teknologi Universitas Sanata Dharma

Yogyakarta.


xi

6. Bapak Puspaningtyas Sanjoyo Adi, S.T.,M.T. selaku Dosen Pembimbing

Akademik .

7. Ibu Agnes Maria Polina, S.Kom,M.Sc, dan Bapak Robertus Adi Nugroho,

S.T., M.Eng selaku Dosen Penguji, atas kritik dan saran yang telah diberikan.

8. Seluruh Dosen jurusan Teknik Informatika Universitas Sanata Dharma, yang

telah mengajarkan banyak ilmu kepada penulis.

9. Para sahabat Fany, Evi , terimakasih atas doa, dan dukungan kalian bagi

penulis.

10. Untuk Meity, Lia, Kezia, Monic, terima kasih atas dukungan dan bantuannya

selama ini bagi penulis.

11. Seluruh teman-teman TI angkatan 2011 untuk kebersamaan kita selama

menjalani masa perkuliahan ini.

12. Serta semua pihak yang telah membantu penyusunan skripsi yang tidak dapat

disebutkan satu, persatu.

Penulisan menyadari bahwa penulisan laporan tugas akhir ini masih memiliki

banyak kekurangan. Untuk itu, penulis sangat membutuhkan saran dan kritik

untuk perbaikan di masa yang akan datang. Semoga penulisan laporan tugas

akhir ini dapat berguna dan bermanfaat bagi semua pihak.

Yogyakarta , 31 Agustus 2015

Penulis


xii

DAFTAR ISI

HALAMAN JUDUL ..................................................................................................... i

HALAMAN JUDUL (BAHASA INGGRIS) ............................................................... ii

HALAMAN PERSETUJUAN ..................................................................................... iii

HALAMAN PENGESAHAN ..................................................................................... iv

HALAMAN PERSEMBAHAN .................................................................................. iv

PERNYATAAN KEASLIAN KARYA ...................................................................... vi

LEMBAR PERNYATAAN PERSETUJUAN ........................................................... vii

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ............... vii

ABSTRAK ................................................................................................................. viii

ABSTRACT ................................................................................................................. ix

KATA PENGANTAR .................................................................................................. x

DAFTAR ISI ............................................................................................................... xii

DAFTAR TABEL ...................................................................................................... xvi

DAFTAR GAMBAR ............................................................................................... xviii

BAB I ............................................................................................................................ 1

PENDAHULUAN ........................................................................................................ 1

1.1 LATAR BELAKANG ...................................................................................... 1

1.2 RUMUSAN MASALAH .................................................................................. 2

1.3 TUJUAN ........................................................................................................... 3

1.4 BATASAN MASALAH ................................................................................... 3

1.5 MANFAAT PENELITIAN ............................................................................... 3

1.6 METODOLOGI PENELITIAN ........................................................................ 4


xiii

1.7 SISTEMATIKA PENULISAN ......................................................................... 5

BAB II ........................................................................................................................... 7

TINJAUAN PUSTAKA DAN DASAR TEORI .......................................................... 7

2.1 TINJAUAN PUSTAKA .................................................................................... 7

2.2 DASAR TEORI ................................................................................................ 8

2.2.1 Ujian Nasional (UN) dan Ujian Sekolah (US) .......................................... 8

2.2.1.1 Ujian Nasional (UN) ......................................................................... 8

2.2.1.2 Ujian Sekolah (US) ........................................................................... 9

2.2.1.3 Standar Kelulusan ............................................................................. 9

2.2.2 Knowledge Discovery in Database (KDD) ............................................. 11

2.2.3 Konsep Clustering .................................................................................. 13

2.2.4 Algoritma Fuzzy C-Means (FCM) .......................................................... 16

2.2.5 Contoh Penerapan Fuzzy C-Means (FCM) ............................................. 19

BAB III ....................................................................................................................... 24

ANALISIS DAN PERANCANGAN SISTEM .......................................................... 24

3.1 ANALISIS KEBUTUHAN ............................................................................. 24

3.1.1 Identifikasi sistem ................................................................................... 24

3.1.2 Use case Diagram ................................................................................... 25

3.1.3 Input Sistem ............................................................................................ 25

3.1.4 Proses Sistem .......................................................................................... 25

3.1.5 Output Sistem .......................................................................................... 27

3.1.6 Kebutuhan Perangkat Lunak ...................................................................... 28

3.1.7 Kebutuhan Perangkat Keras ....................................................................... 28

3.2 PERANCANGAN SISTEM ........................................................................... 28

3.2.1 Desain Proses Umum Sistem .................................................................. 28

3.2.2 Diagram Aktivitas (Activity diagram)..................................................... 31

3.2.3 Diagram Kelas (Class Diagram)............................................................. 31


xiv

3.2.4 Diagram Sekuen (Sequence Diagram) .................................................... 32

3.3 PERANCANGAN ANTAR MUKA ............................................................... 34

3.3.1 Halaman Awal ........................................................................................ 34

3.3.2 Halaman Praproses .................................................................................. 35

3.3.3 Halaman Distribusi Atribut ..................................................................... 35

3.3.4 Halaman Fuzzy C-Means ........................................................................ 36

3.3.5 Halaman Plot Klaster .............................................................................. 37

3.3.6 Halaman Bantuan .................................................................................... 38

BAB IV ....................................................................................................................... 39

IMPLEMENTASI DAN PENGUJIAN SISTEM ....................................................... 39

4.1 IMPLEMENTASI ANTAR MUKA ............................................................... 40

4.1.1 Implementasi Halaman Awal .................................................................. 40

4.1.2 Implementasi Halaman Praproses Data .................................................. 40

4.1.3 Implementasi Halaman Distribusi Atribut .............................................. 42

4.1.4 Implementasi Halaman Fuzzy C-Means ................................................. 43

4.1.5 Implementasi Halaman Plot Clustering .................................................. 45

4.1.6 Implementasi Halaman Bantuan ............................................................. 45

4.2 IMPLEMENTASI KELAS ............................................................................ 46

4.2.1 Implementasi Kelas MenuAwal .............................................................. 46

4.2.2 Implementasi Kelas PraprosesGUI ......................................................... 47

4.2.3 Implementasi Kelas Distribusi Atribut ................................................... 49

4.2.4 Implementasi Kelas Fuzzy C-Means ....................................................... 51

4.2.5 Implementasi Kelas ScatterAdd .............................................................. 55

4.2.6 Implementasi Kelas tProgram ................................................................. 56

4.3 PENGUJIAN SISTEM .................................................................................... 56

4.3.1 Pengujian Blackbox ................................................................................ 57

4.3.2 Pengujian Validitas Implementasi Algoritm FCM .................................. 58

4.3.2.1 Pengujian Algoritma FCM pada Sistem ......................................... 59


xv

4.3.2.2 Pengujian Perbandingan Hasil Secara Manual dan Sistem ........... 61

4.3.2.3 Pengujian Perubahan Nilai Galat(e) dan Maksimal Iterasi(i) ........ 62

4.3.2.4 Pengujian Perbandingan Hasil Sistem dengan Matlab .................. 64

4.4 KELEBIHAN DAN KEKURANGAN SISTEM ............................................ 75

4.4.1 Kelebihan Sistem .................................................................................... 75

4.4.2 Kekurangan Sistem ................................................................................. 76

BAB V ........................................................................................................................ 77

KESIMPULAN DAN SARAN ................................................................................... 77

5.1 KESIMPULAN ............................................................................................... 77

5.2 SARAN ........................................................................................................... 77

DAFTAR PUSTAKA ................................................................................................. 78

LAMPIRAN ................................................................................................................ 79

LAMPIRAN TABEL RINGKASAN USECASE .................................................... 79

LAMPIRAN DIAGRAM AKTIFITAS (ACTIVITY DIAGRAM) ........................... 80

LAMPIRAN DIAGRAM KONTEKS .................................................................... 85

LAMPIRAN UJI PERUBAHAN NILAI GALAT(E), DAN MAKSIMAL ITERASI

(I) ............................................................................................................................. 86

LAMPIRAN DATA UJI MATLAB ........................................................................ 90

LAMPIRAN GAMBAR SCREENSHOT UJI MATLAB....................................... 91

LAMPIRAN GAMBAR SCREENSHOT HASIL UJI SISTEM ............................. 97

LAMPIRAN PERBANDINGAN DETAIL TABEL 4.14 ..................................... 104

LAMPIRAN UJI MANUAL ................................................................................. 108

LAMPIRAN UJI PEMBAHASAN ....................................................................... 118


xvi

DAFTAR TABEL

Tabel 2.1 Kunjungan Objek Wisata .......................................................................... 19

Tabel 2.2 Pembangkitan Matriks partisi Uik ............................................................. 20

Tabel 2.3 Perhitungan Pusat Cluster v1 .................................................................... 20



Tabel 4.1 Tabel nama kelas yang diimplementasikan .............................................. 39

Tabel 4.2 Tabel Hasil Pengujian Blackbox ............................................................... 57

Tabel 4.3 Tabel Data Uji Algoritma FCM ................................................................ 58

Tabel 4.4 Sampel Data Uji Secara Manual dan Sistem ............................................ 61

Tabel 4.5 Uji Perbandingan Algoritma FCM Secara Manual dan Sistem ................ 62

Tabel 4.6 Hasil uji perbandingan member percluster secara manual dan

sistem ....................................................................................................... 62

Tabel 4.7 Uji perubahan nilai Galat ( e) dan maksimal Iterasi (i) ............................. 63

Tabel 4.8 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............... 64

Tabel 4.9 Hasil uji perbandingan member percluster nilai ujian nasional, nilai

sekolah ...................................................................................................... 64

Tabel 4.10 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............. 68

Tabel 4.11 Hasil uji perbandingan member percluster nilai ujian .......................... 68

Tabel 4.12 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............. 71


xvii

Tabel 4.13 Hasil uji perbandingan member percluster nilai ujian sekolah .............. 71

Tabel 4.14 Hasil uji perbandingan hasil jumlah member percluster ....................... 75


xviii

DAFTAR GAMBAR

Gambar 1.1 Metodologi Perangkat Lunak (Classic life Cycle/Waterfall) ................. 4

Gambar 2.1 Tahapan proses sebuah sistem KDD (Jiawei Han & Micheline

Kamber,2006) ........................................................................................ 12

Gambar 3.1 Use Case Diagram ................................................................................. 25

Gambar 3.2 Flowchart Algoritma Fuzzy C-Means .................................................... 27

Gambar 3.3 Proses buka dan cek berkas input .......................................................... 28

Gambar 3.4 Desain Proses Clustering Fuzzy C-Means pada aplikasi ....................... 30

Gambar 3.5 Diagram Kelas ........................................................................................ 32

Gambar 3.6 Diagram Sekuen Buka Berkas ............................................................... 32

Gambar 3.7 Diagram Sekuen Clustering ................................................................... 33

Gambar 3.8 Rancangan Halaman Awal ..................................................................... 34

Gambar 3.9 Rancangan Halaman Praproses ............................................................. 35

Gambar 3.10 Rancangan Halaman Distribusi Atribut ............................................... 36

Gambar 3.11 Rancangan Halaman Fuzzy C-Means................................................... 37

Gambar 3.12 Rancangan Halaman Plot Klaster......................................................... 37

Gambar 3.13 Halaman Bantuan ................................................................................. 38

Gambar 4.1 Antarmuka Halaman Awal .................................................................... 40

Gambar 4.2 Antarmuka Halaman Praposes Data...................................................... 41

Gambar 4.3 Antarmuka Halaman Praposes Data (Berkas .xls atau .csv) ................ 41

Gambar 4.4 Antarmuka Halaman Praposes Data (Hapus Atribut) ........................... 42


xix

Gambar 4.5 Antarmuka Halaman Distribusi Atribut ................................................ 43

Gambar 4.6 Antarmuka Halaman Fuzzy C-Means ................................................... 43

Gambar 4.7 Antarmuka Halaman Fuzzy C-Means (Clustering) ............................... 44

Gambar 4.8 Antarmuka Halaman Plot Klaster ......................................................... 45

Gambar 4.9 Antarmuka Halaman Bantuan ............................................................... 46

Gambar 4.10 Pengujian Algoritma FCM pada Sistem ............................................. 59


1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Penambangan data (Data mining) adalah kegiatan yang meliputi

pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau

hubungan dalam set data berukuran besar. Penambangan data dalam bidang

pendidikan, berfokus pada pengembangan metode-metode untuk mengekstrak

knowledge dari data-data pendidikan. Data pendidikan dapat berupa data pribadi

atau akademik. Penambangan data berkembang menjadi alat bantu untuk mencari

pola-pola yang berharga dalam suatu database yang sangat besar jumlahnya,

sehingga tidak memungkinkan dicari secara manual.

Clustering adalah salah satu teknik dari penambangan data. Teknik

penambangan data seperti clustering dapat digunakan untuk pengelompokan dan

analisis. Clustering adalah proses pengelompokan atau segmentasi sejumlah data

objek menjadi beberapa cluster yang mirip satu sama lain antar objeknya. Kondisi

kualitas cluster yang baik dimana pada saat cluster memiliki homogenitas internal

yang tinggi dan heterogenitas eksternal yang tinggi. Beberapa algoritma telah

dikembangkan untuk melakukan clustering. Salah satu algoritma untuk clustering

adalah Fuzzy C-Means (FCM).

Fuzzy C-Means (FCM), dikenal juga sebagai Fuzzy ISODATA. Fuzzy C-

Means merupakan salah satu algoritma dari cluster analysis , dimana keberadaan

tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat atau tingkat

keanggotaannya. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada

tahun 1981. Fuzzy C-Means menerapkan pengelompokan fuzzy dimana setiap data

memungkinkan menjadi bagian anggota dari beberapa cluster dengan

keanggotaan yang berbeda-beda untuk setiap cluster. Fuzzy C-Means memiliki

tujuan yaitu mendapatkan pusat cluster sehingga dapat digunakan untuk

mengetahui data yang ada di dalam sebuah cluster (Kusumadewi S, 2010).


2

Kelebihan yang dimiliki oleh Fuzzy C-Means adalah clustering dapat dilakukan

lebih dari satu variabel secara bersamaan (Hadi HY,2005).

Algoritma Fuzzy C-Means (FCM) dapat diimplementasikan pada

sekumpulan data numerik dalam proses pengelompokan data. Salah satu contoh

data numerik yaitu data sekolah yang berupa data nilai ujian nasional dan nilai

sekolah.

Permendiknas No. 63 tahun 2009 tentang Sistem Penjaminan Mutu

Pendidikan (SPMP) pasal 20 dimana dinyatakan salah satu jenis kegiatan

penjaminan mutu pendidikan adalah evaluasi dan pemetaan mutu satuan atau

program pendidikan oleh Pemerintah, pemerintah provinsi, dan pemerintah

kabupaten atau kota. Pemerintah telah menentukan kebijakan dalam

meningkatkan standar mutu pendidikan dengan melakukan Ujian Nasional (UN)

dan Ujian Sekolah (US) setiap tahunnya.

Konsep clustering adalah membagi data menjadi kelompok-kelompok

dapat membantu dalam proses pengelompokan Sekolah Menengah Atas

khususnya yang ada di DIY berdasarkan data Nilai Ujian Nasional dan Nilai

Sekolah.

Berdasarkan hal diatas, maka penulis tertarik untuk mengimplementasikan

algoritma Fuzzy C-Means dan mengangkat judul skripsi yaitu “Implementasi

Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Atas di DIY

berdasarkan Nilai Ujian Nasional dan Nilai Sekolah” untuk membantu dan

mempermudah dalam proses pengelompokan data Sekolah Menengah Atas

dengan algoritma Fuzzy C-Means .

1.2 Rumusan Masalah

Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan

adalah:

1. Bagaimana mengimplementasikan algoritma Fuzzy C-Means untuk

mengelompokkan sekolah menengah atas di DIY berdasarkan nilai

Ujian Nasional dan Nilai Sekolah?


3

2. Apakah implementasi algoritma Fuzzy C-means dapat dipergunakan

untuk mengelompokan sekolah dengan valid?

1.3 Tujuan

Penelitian ini bertujuan membantu, mendesain, mengimplementasikan

algoritma Fuzzy C-Means untuk mempermudah pengguna dalam

mengelompokkan Sekolah Menengah Atas berdasarkan nilai ujian nasional dan

nilai sekolah dengan algoritma Fuzzy C-Means.

1.4 Batasan Masalah

Batasan masalah dalam penelitian ini adalah:

1. Metode yang digunakan dalam penelitian ini adalah metode clustering

algoritma Fuzzy C-Means

2. Data uji yang digunakan adalah data nilai ujian nasional dan nilai Sekolah

Menengah Atas di Daerah Istimewa Yogyakarta pada tahun 2011 - 2014.

3. Atribut-atribut clusteringnya berupa nilai mata ujian sekolah (US) dan

ujian nasional (UN) yang diujikan di jurusan IPA dan IPS di wilayah

provinsi DIY . Meliputi, nilai mata pelajaran Bahasa Indonesia, Bahasa

Inggris, Matematika, Kimia, Fisika, Biologi untuk jurusan IPA, dan nilai

mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, Geografi,

Sosiologi, Ekonomi untuk jurusan IPS.

4. Aplikasi akan dibuat mengunakan pemrograman Java Desktop Standard

Edition (J2SE).

1.5 Manfaat Penelitian

Manfaaat yang diperoleh dalam penelitian ini antara lain:

1. Memberikan gambaran tentang langkah – langkah desain, dan

implementasi algoritma Fuzzy C-Means dalam menghasilkan

pengelompokan Sekolah Menengah Atas berdasarkan nilai ujian

nasional dan nilai sekolah.


4

2. Sebagai refensi bagi penelitian yang berkaitan dengan clustering

pemetaan atau pengelompokan sekolah yang lebih lanjut.

1.6 Metodologi Penelitian

Metode yang dipergunakan untuk merancang sistem dan menyelesaikan

permasalahan adalah dengan cara sebagai berikut.

1. Studi pustaka

Penyusun mencari liteatur-literatur untuk mengenal dan mempelajari cara

kerja dari algoritma Fuzzy C-Means.

2. Pengembangan Sistem

Pada tahap ini penulis menggunakan paradigma waterfall. Adapun

metode waterfall mempunyai tahapan-tahapan sebagai berikut :

Gambar 1.1 Metodologi Perangkat Lunak (Classic life Cycle/Waterfall)

(Pressman,2002)

Keterangan :

a. Rekayasa perangkat lunak (Software Engineering), merupakan

kegiatan untuk menentukan software apa yang akan dibangun.

b. Analisis perangkat lunak (Software Analysis), dilakukan dengan cara

menganalisa kebutuhan akan fungsi – fungsi perangkat lunak yang

Analysis

Design

Coding

Testing

Maintenance

Sistem

Engineering


5

dibutuhkan. Adapun fungsi – fungsi tersebut meliputi fungsi

masukan, fungsi proses, dan fungsi keluaran.

c. Perancangan perangkat lunak (Software Design), merupakan

perancangan perangkat lunak yang dilakukan berdasarkan data – data

yang telah dikumpulkan pada tahap sebelumnya. Perancangan

tersebut meliputi perancangan struktur file, struktur menu, struktur

program, format masukan (input), dan format keluaran (output).

d. Implementasi perangkat lunak (Coding), yaitu kegiatan yang

mengimplementasikan hasil dari perancangan perangkat lunak

kedalam kode program yang dimengerti oleh bhasa mesin.

e. Pengujian perangkat lunak (Testing), memfokuskan pada logika

internal dari perangkat lunak, fungsi eksternal, dan mencari segala

kemungkinan kesalahan, memeriksa apakah input sesuai dengan

hasil yang diinginkan setelah proses.

f. Pemeliharaan perangkat lunak (Maintenance), merupakan suatu

kegiatan untuk memelihara perangkat lunak yang sudah dibuat,

pemeliharaan tersebut dilakukan agar keutuhan program dapat

terjaga seperti validasi data, update data, dan integrasi data.

3. Validasi hasil

Pada tahap ini dilakukan validasi terhadap hasil pengujian aplikasi

terhadap hasil perhitungan manual, dan dengan hasil uji algoritma FCM dengan

tools matlab

1.7 SISTEMATIKA PENULISAN

Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematika

penulisan sebagai berikut:

BAB I. PENDAHULUAN

Pendahuluan berisi tentang latar belakang masalah, rumusan masalah,

tujuan, batasan masalah, manfaat penelitian, metode penelitian dan sistematika

penulisan.


6

BAB II. TINJAUAN PUSTAKA DAN DASAR TEORI

Tinjauan pustaka dan dasar teori berisi tentang sumber acuan , penjelasan

dan uraian singkat mengenai teori-teori yang berkaitan dengan topik dari tugas

akhir ini.

BAB III. ANALISIS DAN PERANCANGAN SISTEM

Analisis dan perancangan sistem berisi tentang identifikasi sistem meliputi

Analisa kebutuhan, use case diagram, input, proses dan output, kebutuhan

perangkat keras dan perangkat lunak, serta perancangan sistem seperti,disain

umum sistem, , activity diagram, class diagram, ,sequence diagram, dan

rancangan antarmuka sistem.

BAB IV. IMPLEMENTASI DAN PEMBAHASAN SISTEM

Implementasi sistem berisi tentang implementasi program dari sistem yang

akan dibuat, pembahasan sistem, implementasi antarmuka, hasil implementasi

pemrograman, dan pengujian sistem dengan data yang sudah siap untuk diproses.

BAB V. KESIMPULAN DAN SARAN

Kesimpulan dan saran berisi tentang kesimpulan dari sistem yang telah

dibuat, serta saran untuk pengembangan dan penyempurnaan Tugas Akhir yang

dibuat


7

BAB II

TINJAUAN PUSTAKA DAN DASAR TEORI

2.1 Tinjauan Pustaka

Asih (2008) meneliti tentang penerapan algoritma Fuzzy C-Means untuk

pengelompokan penduduk berdasarkan kemampuan ekonominya. Penelitian ini

menggunakan kriteria jumlah penghasilan, luas bangunan tempat tinggal dan

rekening listrik sebagai atribut pengelompokan. Hasil dari penelitian ini berupa

suatu aplikasi yang dapat mengelompokan penduduk menjadi 2 cluster yakni

mampu dan tidak mampu, serta juga dapat mengelompokkan penduduk menjadi 4

cluster yaitu penduduk Pra Sejahtera, Keluarga Sejahtera I, Keluarga Sejahtera II

dan Keluarga Sejahtera III.

Ernawati dan Susanto (2009), meneliti tentang penerapan Fuzzy Clustering

untuk pembagian kelas peserta kuliah . Penelitian ini menggunakan sampel 121

orang mahasiswa Jurusan Teknik Informatika Universitas Atma Jaya Yogyakarta

yang menempuh perkuliahan Struktur Data Lanjut. Setiap mahasiswa dicirikan

oleh dua atribut, yaitu nilai yang pernah mereka peroleh untuk dua mata kuliah

prasyarat (Algoritma dan Pemrograman dan Struktur Data). Dalam pembahasan

untuk menilai anggota kelompok yang sah dan valid, menggunakan ukuran

Fukuyama-Sugeno’s Fuzzy Cluster Validity Index. Hasil dari penelitian ini adalah

pembagian kelas para peserta kuliah sebagai hasil penerapan algoritma Fuzzy

Clustering terhadap data ke-121 peserta mata kuliah Struktur Data Lanjut untuk

pelbagai kemungkinan jumlah kelas, dan rekomendasi peserta kelas yang valid.

Luthfi (2007), meneliti tentang algoritma Fuzzy C-Means untuk Clustering

Data Performance Mengajar Dosen Dalam penelitian tersebut dilakukan

percobaan untuk mengetahui kemungkinan adanya cluster-cluster dari data

performance mengajar dosen. Penelitian menggunakan beberapa kriteria sebagai

acuan dalam proses clustering yaitu: penguasaan dan kemampuan dalam

menjelaskan materi, kemampuan dalam menjawab pertanyaan, kemampuan dalam

member motivasi mahasiswa, kemampuan dalam membuat suasana kelas

menyenangkan dan kedisiplinan hadir dalam perkuliahan. Penelitian ini berhasil


8

memunculkan beberapa custer data yang dapat dianalisis lebih lanjut persamaan

dan perbedaannya. Dari 4 pusat cluster yang di set di awal iterasi, ada 2 cluster

yang mempunyai nilai sama, yaitu cluster 3 dan cluster 4, dengan demikian hanya

dihasilkan 3 buah cluster performance mengajar dosen.

2.2 Dasar Teori

2.2.1 Ujian Nasional (UN) dan Ujian Sekolah (US)

2.2.1.1 Ujian Nasional (UN)

Ujian nasional (UN) merupakan kebijakan pemerintah dalam bidang

pendidikan untuk menentukan standar mutu pendidikan. Pemerintah telah

menetapkan nilai standar kelulusan UN minimal yang harus dicapai oleh peserta

didik dalam kelulusan.

Tujuan UN adalah untuk mengukur pencapaian hasil belajar siswa;

mengukur mutu pendidikan di tingkat nasional, provinsi, kabupaten atau kota, dan

sekolah/madrasah; dan mempertanggungjawabkan penyelenggaraan pendidikan

secara nasional, provinsi, kabupaten atau kota, dan sekolah/ madrasah, kepada

masyarakat. UN tetap penting karena tidak hanya untuk memetakan kualitas

sekolah, tetapi juga mengetahui kualitas murid dan standarisasi pendidikan. UN

adalah sebuah tes yang dikategorikan sebagai high-stakes (taruhan besar) karena

digunakan untuk menjadi penentu utama dalam menilai siswa, dan bahkan

menjadi penentu utama untuk menetapkan apakah seorang siswa lulus atau tidak.

Dalam pelaksanaan UN 2014, Badan Standar Nasional Pendidikan

(BSNP) menerbitkan Prosedur Operasi Standar Kelulusan UN 2014 SMP/MTs,

SPMLB dan SMK No. 22 Th 2013. Pemerintah telah mengambil kebijakan untuk

menerapkan UN sebagai salah satu bentuk evaluasi pendidikan. Menurut Surat

Edaran Bersama Menteri Pendidikan Nasional No.420 tahun 2014 tentang UN

tahun pelajaran 2013/2014 disebutkan bahwa tujuan UN adalah untuk mengukur

pencapaian hasil belajar peserta didik melalui pemberian tes pada siswa SLTP dan

siswa SLTA. Selain itu UN bertujuan untuk mengukur mutu pendidikan dan


9

mempertanggungjawab-kan penyelengga-raan pendidikan di tingkat nasional,

provinsi, kabupaten, sampai tingkat sekolah.

UN berfungsi sebagai alat pengendalian mutu pendidikan secara nasional,

pendorong peningkatan mutu pendidikan secara nasional, bahan dalam

menentukan kelulusan peserta didik, dan sebagai bahan pertimbangan dalam

seleksi penerimaan pada jenjang pendidikan yang lebih tinggi. UN merupakan

salah satu bentuk evaluasi belajar pada akhir tahun pelajaran yang diterapkan pada

beberapa mata pelajaran yang dianggap penting.

2.2.1.2 Ujian Sekolah (US)

US adalah ujian yang dilaksanakan oleh sekolah, dan mata pelajaran yang

diujikan dtentukan oleh sekolah sendiri. Untuk dinyatakan lulus, bukan hanya

lulus UN berarti dinyatakan lulus. Tetapi harus US juga dinyatakan lulus. Hasil

lulus UN dan UAS ini sangat penting dalam kelulusan siswa. Jika salah satunya

tidak lulus sama dengan tidak lulus.

2.2.1.3 Standar Kelulusan

Sistem penilaian biasa digunakan, yakni penilai acuan norma (PAN) dan

penilaian acuan patokan (PAP). Batas kelulusan hasil penilaian mempunyai kaitan

dengan kedua sistem penilai tersebut. Dengan demikian, ada batas kelulusan yang

berorientasi pada PAN, yakni batas lulus aktual dan batas lulus ideal. Di samping

itu ada batas kelulusan yang berorientasi kepada sistem PAP, yakni batas lulus

purposif. Deskripsi ketiga batas kelulusan di atas sebagai berikut.

1. Batas lulus aktual.

Batas lulus aktual didasarkan atas nilai rata-rata yang dapat dicapai oleh

kelompok siswa. Unsur yang diperlukan untuk menentukan batas lulus

actual adalah nilai rata-rata aktual dan simpangan baku aktual. Biasanya

skor yang dinyatakan lulus adalah skor di atas ( X + 0,25 SD ) dimana X

adalah nilai rata-rata kelas dan SD adalah simpangan baku. Misalnya siswa

kelas III SMA diberi tes bahasa Inggris dengan menggunakan bentuk

pilihan ganda sebanyak 60 pertanyaan. Setiap pertanyaan yang dijawab


10

benar diberi skor satu, sehingga skor maximal yang mungkin dicapai

adalah siswa sebanyak 60. kemudian dihitung nilai rata-ratanya (X) dari

semua siswa yang ada di kelas tersebut, misalnya 25 dan simpangan

bakunya (SD) adalah 8,0. dengan demikian, skor yang dinyatakan lulus

adalah 25 + 0,25 (8,0) = 27, Skor-skor di atas 27 dinyatakan lulus

sedangkan skor di bawah 27 dinyatakan gagal atau tidak lulus.

2. Batas lulus ideal

Batas lulus ideal sama dengan batas lulus aktual, yaitu menentukan batas

lulus dengan menggunakan nilai rata-rata dan simpangan baku ideal. Nilai

rata-rata dan simpangan baku dalam batas lulus ideal mudah dihitung

menggunakan aturan sebagai berikut: Nilai rata-rata ideal adalah setengah

dari maksimum skor. Simpangan baku ideal adalah sepertiga dari nilai

rata-rata ideal. Misalnya, kembali pada contoh dalam batas lulus aktual.

Skor maksimum yang mungkin dicapai dari tes bahasa Inggris adalah 60.

rata-rata idealnya adalah setengah dari 60, yakni 30, sedangkan simpangan

bakunya adalah sepertiga dari rata-rata ideal, yakni 10. batas lulusan

idealnya adalah 30 + 0,25 (10) = 32,50. skor dia atas 32,50 dinyatakan

lulus, sedangkan skor di bawah 32,50 dinyatakan gagal atau tidak lulus.

3. Batas lulus purposif

Batas lulus purposif mengacu pada PAP sehingga tidak perlu menghitung

nilai rata-rata dan simpangan baku. Dalam hal ini ditentukan kriteria-nya,

misalnya 75%. Artinya skor yang dinyatakan lulus adalah skor di atas 75

% dari skor maksimum. Pada contoh di atas maka batas lulusnya adalah

75% dari 60, yakni 45. skor yang besarnya di atas 45 dinyatakan lulus dan

yang berada di bawahnya dinyatakan gagal atau tidak lulus. Makin tinggi

kriteria kelulusannya, maka makin tinggi pula kualitas hasil belajar yang

dituntutnya. Sebaliknya, makin rendah kriterianya, makin rendah pula

kualitas hasil belajar yang dihasilkannya (Sudjana, 2001:106-107).

Standar kriteria kelulusan dalam UAN sudah ditetapkan dalam POS

kelulusan UN yaitu 5,5. Artinya skor di atas 5,5 dinyatakan lulus,

sedangkan skor di bawah 5,5 dinyatakan gagal atau tidak lulus. Batas


11

kelulusan yang digunakan dalam UN adalah menggunakan sistem

penilaian acuan patokan (PAP), yakni batas lulus purposif. Hasil UN

digunakan sebagai salah satu pertimbangan untuk (PerMenDikBud

No.3/2013):

1. Pemetaan mutu satuan dan/atau program pendidikan

2. Seleksi masuk jenjang berikutnya

3. Penentuan kelulusan peserta didik dari suatu satuan pendidikan

4. Akreditasi satuan pendidikan

5. Pembinaan dan pemberian bantuan kepada satuan pendidikan dalam upaya

peningkatan mutu pendidikan.

2.2.2 Knowledge Discovery in Database (KDD)

Knowledge Discovery in Database (KDD) adalah kegiatan yang meliputi

pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau

hubungan dalam set data berukuran besar. Data mining (Penambangan data)

merupakan bagian dari Knowledge Discovery in Database yang merupakan

kegiatan yang meliputi pengumpulan , pemakaian data historis untuk menemukan

keteraturan, pola atau hubungan dalam data yang berukuran besar (Santosa, 2007).

Istilah data mining dan KDD sering disalah artikan secara bergantian untuk

menjelaskan proses penggalian informasi tersembunyi dalam suatu kumpulan data

yang besar. Data mining dan KDD memiliki konsep yang berbeda tetapi saling

berkaitan satu sama lain. Salah satu tahapan dalam proses KDD adalah data

mining (Han&Kamber,2006). Sebagai komponen dalam KDD, data mining

berkaitan dengan ekstrasi dan penghitungan pola-pola dari data yang terdembunyi

dalam database.

Tahapan KDD merupakan suatu rangkaian proses data mining dan dapat

dibagi menjadi beberapa tahap. Tahap-tahap tersebut bersifat interaktif di mana

pemakai terlibat langsung atau melalui perantara knowledge base.


12

Gambar 2.1 Tahapan proses sebuah sistem KDD

(Jiawei Han &Micheline Kamber,2006)

Tahapan prosesnya yaitu :

1. Pembersihan data (data cleaning)

Pada tahap ini dilakukan untuk proses pembersihan data untuk

menghilangkan noise dan data yang konsisten atau data tidak relevan. Secara

umum data yang diperoleh, memiliki data-data yang tidak sempurna seperti data

yang hilang atau data yang tidak lengkap,data yang mengandung noise, data yang

tidak konsisten atau juga hanya sekedar salah ketik.

2. Integrasi data (data integration)

Pada tahap ini , dilakukan penggabungan data dari berbagai sumber-sember

yang berbeda ke dalam satu database. Integrasi data dilakukan pada atribut-aribut

yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis

produk, nomor pelanggan dan lainnya.

3. Seleksi Data (Data Selection)

Pada proses ini , data yang ada pada database akan diseleksi dan diambil

data yang relevan atau sesuai untuk dianalisis.

4. Transformasi data (Data Transformation)

Pada tahap ini data diubah ke dalam format yang sesuai untuk diproses

dalam data mining. Beberapa metode data mining membutuhkan format data yang


13

khusus sebelum bisa diaplikasikan. Proses ini meliputi : penghalusan, agregasi,

generalisasi dari data, normalisasi dan konstruksi atribut atau fitur.

5. Proses data mining

Pada tahap ini, merupakan suatu proses utama saat metode diterapkan untuk

mengekstrasi pola data, menemukan pengetahuan atau knowledge yang berharga

dan tersembunyi dari data.

6. Evaluasi pola (pattern evaluation),

Pada tahap ini, dilakukan identifikasi pola-pola yang meresentasikan

knowledge atau berdasarkan beberapa pengukuran yang menarik atau penting.

7. Presentasi pengetahuan (knowledge presentation),

Pada tahap ini, merupakan visualisasi dan penyajian pengetahuan mengenai

metode yang digunakan untuk memperoleh pengetahuan yang diperoleh

pengguna. Tahap terakhir dari proses data mining adalah bagaimana

memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Dalam

presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data

mining.

Tahap 1 sampai tahap 4 termasuk dalam data preprocessing, dimana data

disiapkan untuk di mining. Setelah melakukan tahapan preprocessing maka

hasilnya siap di proses mining. Data yang dipakai merupakan sekumpulan obyek

data dan atribut.

2.2.3 Konsep Clustering

Konsep dasar data mining (penambangan data) adalah menemukan

informasi tersembunyi dalam sebuah basis data dan merupakan bagian dari

Knowledge Discovery in Database (KDD) untuk menemukan informasi dan pola

yang berguna dalam data (Dunham, 2003). Data mining mencari informasi baru,

berharga dan berguna dalam sekumpulan data dengan melibatkan komputer dan

manusia serta bersifat iteratif baik melalui proses yang otomatis ataupun manual.

Secara umum sifat data mining adalah:


14

a. Predictive: menghasilkan model berdasarkan sekumpulan data yang dapat

digunakan untuk memperkirakan nilai data yang lain. Metode yang termasuk

dalam prediktif data mining adalah:

1) Klasifikasi: pembagian data ke dalam beberapa kelompok yang telah

ditentukan sebelumnya.

2) Regresi: memetakan data ke suatu prediction variable.

3) Time Series Analisys: pengamatan perubahan nilai atribut dari waktu ke

waktu.

b. Descriptive: mengidentifikasi pola atau hubungan dalam data untuk

menghasilkan informasi baru. Metode yang termasuk dalam deskriptif data

mining adalah:

1) Clustering: identifikasi kategori untuk mendeskripsikan data.

2) Association Rules: Identifikasi hubungan antar data yang satu dengan yang

lainnya.

3) Summarization: pemetaan data ke dalam subset dengan deskripsi

sederhana.

4) Sequence Discovery: identifikasi pola sekuensial dalam data

Clustering membagi data menjadi kelompok-kelompok atau cluster

berdasarkan suatu kemiripan atribut-atribut diantara data tersebut(Dunham, 2003).

Karakteristik tiap cluster tidak ditentukan sebelumnya, melainkan tercermin dari

kemiripan data yang terkelompok di dalamnya. Oleh sebab itu hasil clustering

seringkali perlu diinterprestasikan oleh pihak-pihak yang benar-benar mengerti

mengenai karakter domain data tersebut. Selain digunakan sebagai metode yang

independen dalam data mining, clustering juga digunakan dalam pra-pemrosesan

data sebelum data diolah dengan metode data mining yang lain untuk

meningkatkan pemahaman terhadap domain data.

Karakteristik terpenting dari hasil clustering yang baik adalah suatu

instance data dalam suatu cluster lebih ”mirip” dengan instance lain di dalam

cluster tersebut daripada dengan instance di luar dari cluster itu (Kantardzic,

2003). Ukuran kemiripan (similarity measure) tersebut bisa bermacam-macam

dan mempengaruhi perhitungan dalam menentukan anggota suatu cluster. Jadi


15

tipe data yang akan di-cluster (kuantitatif atau kualitatif) juga menentukan ukuran

apa yang tepat digunakan dalam suatu algoritma. Selain kemiripan antar data

dalam suatu cluster, clustering juga dapat dilakukan berdasarkan jarak antar data

atau cluster yang satu dengan yang lainnya.Ada beberapa macam rumus

perhitungan jarak antar cluster. Untuk Tipe data numerik, sebuah data set X

beranggotakan x1∈ X, i = 1, ..., n, tiap item direpresentasikan sebagai vektor X1=

{Xi1, Xi2, Xim} dengan m sebagai jumlah dimensi dari item. Rumus-rumus yang

biasa digunakan sebagai ukuran jarak antara

Xi dan Xj untuk data numerik ini antara lain:

a. Euclidean Distance

..................................................(2.1)

Ukuran ini sering digunakan dalam clustering karena sederhana. Ukuran

ini memiliki masalah jika skala nilai atribut yang satu sangat besar

dibandingkan nilai atribut lainnya. Oleh sebab itu, nilai-nilai atribut sering

dinormalisasi sehingga berada dalam kisaran 0 dan 1.

b. Manhattan Distance

..............................................................(2.2)

Jika tiap item digambarkan sebagai sebuah titik dalam grid, ukuran jarak

ini merupakan banyak sisi yang harus dilewati suatu titik untuk mencapai

titik yang lain seperti halnya dalam sebuah peta jalan.

c. Minkwoski Metric

...........................................................(2.3)

Ukuran ini merupakan bentuk umum dari Euclidean Distance dan

Manhattan Distance. Euclidean Distance adalah kasus dimana nilai p=2

sedangkan Manhattan Distance merupakan bentuk Minkwoski dengan

p=1. Dengan demikian, lebih banyak nilai numerik yang dapat

ditempatkan pada jarak terjauh di antara 2 vektor. Seperti pada Euclidean


16

Distance dan juga Manhattan Distance, ukuran ini memiliki masalah jika

salah satu atribut dalam vektor memiliki rentang yang lebih besar

dibandingkan atribut-atribut lainnya.

d. Cosine – Corelation (ukuran kemiripan dari model Euclidean n-dimensi)

..........................................................(2.4)

Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi

walaupun sering pula digunakan bersama pendekatan lain untuk

membatasi dimensi dari permasalahan.

Dalam mendefenisikan ukuran jarak antar cluster yang digunakan

beberapa algoritma untuk menentukan cluster mana yang terdekat, perlu

dijelaskan mengenai atribut-atribut yang menjadi referensi dari suatu cluster

(Kantardzic, 2003). Untuk suatu cluster Km berisi N item {Xm1, Xm2, ...,

Xmn}:

a) Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap

itemdari suatu cluster menurut rumus:

...........................................................(2.5)

b) Medoid: item yang letaknya paling tengah

2.2.4 Algoritma Fuzzy C-Means (FCM)

Ada beberapa algoritma clustering data, salah satu diantaranya adalah

Fuzzy C-Means (FCM). FCM adalah suatu teknik clustering data yang mana

keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat

keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun

1981.

Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang

akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat

cluster ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan


17

untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat

keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa

pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan

pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang

diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data

tersebut.

Dalam metode Fuzzy C Means dipergunakan variabel membership

fucntion iku, yang merujuk pada seberapa besar kemungkinan suatu data bisa

menjadi anggota ke dalam suatu cluster . Pada metode ini juga digunakan

suatu variabel m yang merupakan weighting exponent dari membership function.

Variabel ini dapat mengubah besaran pengaruh dari membership function iku

dalam proses clustering. Variabel m mempunyai wilayah nilai m > 1 , sampai

pada saat ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal

dalam melakukan optimasi suatu permasalahan clustering. Nilai m yang umum

digunakan adalah 2 (Wahyuni,2009) .

Secara mendasar terdapat dua cara pengalokasian data kembali kedalam

masing-masing cluster pada saat proses iterasi clustering. Yang pertama adalah

pengalokasian dengan cara tegas (hard). Dimana data item secara tegas

dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster

yang lain. Yang kedua dengan menggunakan nilai Fuzzy dimana masing-masing

data item diberikan nilai kemungkinan untuk bisa bergabung ke setiap cluster

yang ada. Pada K-Means pengalokasian data kembali didasarkan pada

perbandingan jarak antara data dengan centroid setiap cluster yang ada. Pada

Fuzzy C Means pengalokasian kembali data kedalam masing-masing cluster

dipergunakan variabel membership function uik yang merujuk pada seberapa besar

kemungkinan suatu data bisa menjadi anggota dalam satu cluster.

Keluaran dari FCM bukan merupakan sistem inferensi fuzzy, namun

merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap –

tiap titik data.

Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut (Kusumadewi,2010).


18

1. Masukan data yang akan di cluster U , berupa matriks berukuranmxn (n =

jumlah sampel data,m = atribut setiap data). Uik = data sampel ke-i (

i=1,2,...,n),atribut ke- k( k =1,2,...,m).

2. Menetapkan nilai pangkat w (misal: w=2), Eps/galat terkecil (misal:10-5),

MaxIter (misal:100), jumlah cluster c > 1, dan iterasi awal t = 1,

Menetapkan fungsi objektif awal: Pt(c) = 0.

3. Menetapkan matriks partisi µf (c) awal sembarang, sebagai berikut.

4. Menaikkan nomor iterasi: t=t+1.

5. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut

sebagai berikut.

6. Memodifikasi tiap-tiap nilai keanggotaan sebagai berikut.

a. Jika yk ≠ vfi,

b. Jika yk = vfi,

µik (yk) = 1, jika i =g;

µik (yk) = 0, jika i ≠g;

7. Menghitung fungsi objektif sebagai berikut.

8. Memodifikasi matriks partisi sebagai berikut.


19

9. Memeriksa kondisi untuk berhenti, yaitu:

(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter)

Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-4.

2.2.5 Contoh Penerapan Fuzzy C-Means (FCM)

Berikut contoh penerapan perhitungan FCM pada kasus kunjungan

pariwisata kota Yogyakarta(Y. Aditya,2010), sebagai berikut.

Tabel 2.1 Kunjungan Objek Wisata

Tempat Tahun

2006 2007 2008 2009 2010

Kraton

Yogyakarta 45,450 31,723 43,103 47,486 58,235

Taman Sari 4,104 5,422 5,424 22,292 12,575

Gembira Loka 43,783 45,357 51,066 88,967 86,857

Purawisata 8,615 13,346 11,346 9,460 13,215

Data pada Tabel 2.1 merupakan data kunjungan wisata dari tahun 2006 -

2010 dalam satuan ribuan orang. Berdasarkan data tersebut ditentukan beberapa

parameter sebagai berikut.

1. Banyaknya cluster yang diinginkan; c = 3

2. Pangkat (pembobot); w = 2

3. Maksimum Iterasi; MaksIter = 1

4. Error Terkecil; Eps = 10-3

5. Fungsi Objektif awal Pt(0) = 0

6. Iterasi awal; t = 1


20

Tabel 2.2 Pembangkitan Matriks partisi Uik

i µik

k1 k2 k3

1 0.8 0.2 0

2 0.1 0.9 0

3 0 0.8 0.2

4 0 1 0

Tabel 2.2 merupakan tahap ke-3 dari perhitungan FCM. Bangkitkan

matriks µik dengan komponen i= banyaknya data; k= banyak cluster (acak dari

nilai 0 - 1). Kemudian ubah nilai iterasi menjadi t=1.

Langkah selanjutnya adalah menghitung pusat cluster v dengan rumus

algoritma langkah 5, sebagai berikut.

Tabel 2.3 Perhitungan Pusat Cluster v1

i µi1w µi1

w* Xi1 µi1w* Xi2 µi1


w* Xi5

1 0.64 29088 20302.72 27585.92 30391.04 37270.4

2 0.01 41.04 54.22 54.24 222.92 125.75

3 0 0 0 0 0 0

4 0 0 0 0 0 0

Jml 0.65 29129.04 20356.94 27640.16 30613.96 37396.15


i µi2w µi2



w* Xi5

1 0.04 1818 1268.92 1724.12 1899.44 2329.4

2 0.81 3324.24 4391.82 4393.44 18056.52 10185.75

3 0.64 28021.12 29028.48 32682.24 56938.88 55588.48

4 1 8615 13346 11346 9460 13215

Jml 2.49 41778.36 48035.22 50145.8 86354.84 81318.63


i µi3w

µi3w*

Xi1

µi3w*

Xi2

µi3w*

Xi3

µi3w*

Xi4

µi3w*

Xi5

1 0 0 0 0 0 0

2 0 0 0 0 0 0

3 0.04 1751.32 1814.28 2042.64 3558.68 3474.28


21

4 0 0 0 0 0 0

Jml 0.04 1751.32 1814.28 2042.64 3558.68 3474.28

Tabel 2.3 - 2.5 merupakan data perhitungan v yang dipisah kan setiap

komponen µij, sehingga hasil akhir dari perhitungan pusat cluster v, sebagai

berikut.

v11 = 29129.04/0.65 = 44813.908

v12 = 20356.94/0.65 = 31318.369

v13 = 27640.16/0.65 = 42523.323

v14 = 30613.96/0.65 = 47098.4

v15 = 37396.15/0.65 = 57532.538

v21 = 41778.36/2.49 = 16778.458

v22 = 48035.22/2.49 = 19291.253

v23 = 50145.8/2.49 = 20138.876

v24 = 86354.84/2.49 = 34680.659

v25 = 81318.63/2.49 = 32658.084

v31 = 1751.32/0.04 = 43783

v32 = 1814.28/0.04 = 45357

v33 = 2042.64/0.04 = 51066

v34 = 3558.68/0.04 = 88967

v35 = 3474.28/0.04 = 86857


22

Langkah berikutnya adalah menghitung fungsi objektif sebagai berikut.

Cluster 1 :

(Xi1 - Vi1)2 (Xi2 -

Vi2)2

(Xi3 -

Vi3)2

(Xi4 -

Vi4)2

(Xi5 -

Vi5)2 P1

404,613 163,726 336,025 150,234 493,452 1,548,051

1,657,296,584 670,621,939 1,376,359,773 615,357,481 2,021,180,265 6,340,816,042

1,062,771 197,083,154 72,977,329 1,752,979,666 859,924,045 2,884,026,964

1,310,360,918 323,006,056 972,025,474 1,416,649,155 1,964,044,215 5,986,085,818

LT1 15,212,476,875

Cluster 2 :

(Xi1 -

Vi1)2

(Xi2 -

Vi2)2

(Xi3 -

Vi3)2 (Xi4 - Vi4)2 (Xi5 - Vi5)2 P2

822,057,330 154,548,333 527,351,014 163,976,767 654,178,615 2,322,112,060

160,641,881 192,356,179 216,527,561 153,478,863 403,330,277 1,126,334,761

729,245,298 679,423,166 956,487,030 2,947,006,859 2,937,522,459 8,249,684,811

66,642,044 35,346,033 77,314,660 636,081,622 378,033,529 1,193,417,887

LT2 12,891,549,519

Cluster 3 :

(Xi1 -

Vi1)2

(Xi2 -

Vi2)2

(Xi3 -

Vi3)2

(Xi4 -

Vi4)2

(Xi5 -

Vi5)2 P3

2,778,889 185,885,956 63,409,369 1,720,673,361 819,218,884 2,791,966,459

1,574,423,041 1,594,804,225 2,083,192,164 4,445,555,625 5,517,815,524 15,215,790,579

0 0 0 0 0 0

1,236,788,224 1,024,704,121 1,577,678,400 6,321,363,049 5,423,144,164 15,583,677,958

LT3 33,591,434,996

Kemudian langkah selanjutnya merupakan perhitungan untuk

memperbarui keanggotaan matriks µij, sebagai berikut.

I µij µij µij

1 0.000101762 0.180126683 0.083115427

2 0.416816807 0.087370006 0.452966376

3 0.189582997 0.639929653 0

4 0.393498433 0.092573657 0.463918197


23

Langkah selanjutnya adalah menghitung kondisi berhenti, dengan pembulatan

nilai desimal yaitu :

(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter)

i P - 0

1 0 0.18 0.08

2 0.42 0.09 0.45

3 0.19 0.64 0

4 0.39 0.09 0.47

Dikarenakan hasilnya belum memenuhi lebih kecil dari Eps/galat = 0,01

maka iterasi berulang sampai galat terpenuhi.


24

BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Analisis Kebutuhan

3.1.1 Identifikasi sistem

Permendiknas No. 63 tahun 2009 tentang Sistem Penjaminan Mutu

Pendidikan (SPMP) pasal 20 dimana dinyatakan salah satu jenis kegiatan

penjaminan mutu pendidikan adalah evaluasi dan pemetaan mutu satuan atau

program pendidikan oleh Pemerintah, pemerintah provinsi, dan pemerintah

kabupaten atau kota. Pemerintah telah menentukan kebijakan dalam

meningkatkan standar mutu pendidikan dengan melakukan Ujian Nasional (UN)

dan Ujian Sekolah (US) setiap tahunnya.

Konsep clustering adalah membagi data menjadi kelompok-kelompok

dapat membantu dalam proses pengelompokan Sekolah Menengah Atas

khususnya yang ada di DIY berdasarkan data Nilai Ujian Nasional dan Nilai

Sekolah.

Sistem ini merupakan implementasi algoritma Fuzzy C-means untuk

melakukan proses pengelompokan (clustering) . Data yang digunakan pada sistem

ini merupakan data yang sudah siap untuk diproses clustering. Data yang

digunakan dalam penelitian yaitu data nilai Ujian Nasional(UN) dan Nilai

Sekolah(NS) khususnya Sekolah Menengah Atas (SMA) di Provinsi DIY tahun

pelajaran 2011 - 2014. Data nilai yang digunakan meliputi nilai mata pelajaran

Bahasa Indonesia, Bahasa Inggris, Matematika, Kimia, Fisika, Biologi untuk

jurusan IPA, dan nilai mata pelajaran Bahasa Indonesia, Bahasa Inggris,

Matematika, Geografi, Sosiologi, Ekonomi untuk jurusan IPS.

Sistem ini bertujuan untuk membantu dan mempermudah Dinas

Pendidikan dalam proses pengelompokkan Sekolah Menengah Atas dengan

menggunakan algoritma Fuzzy C-means.


25

3.1.2 Use case Diagram

Diagram use case digunakan untuk menggambarkan interaksi antara

pengguna dengan sistem. Pengguna sistem ini sebanyak satu orang. Fungsi yang

dapat dijalankan oleh pengguna sistem ini adalah fungsi memasukkan data dalam

bentuk file .xls, atau .csv. Fungsi berikutnya itu seleksi atribut dan distribusi

atribut. Fungsi berikutnya yaitu fungsi proses clustering dengan memasukkan

nilai k,w,i dan e. Fungsi berikutnya yaitu fungsi lihat grafik plot hasil clustering,

dan simpan hasil clustering. Fungsi terakhir yaitu fungsi lihat bantuan. Gambar

dari use case diagram aplikasi dapat dilihat pada Gambar 3.1.

Gambar 3.1 Use Case Diagram

3.1.3 Input Sistem

Sistem clustering dengan algoritma Fuzzy C-Means hanya dapat menerima

masukan dari pengguna berupa file berekstensi .xls atau .csv yang berisi data nilai

ujian nasional dan nilai sekolah pada sekolah menengah atas di Daerah Istimewa

Yogyakarta. Data diambil pada tahun 2011-2014 khususnya jurusan IPA dan IPS.

3.1.4 Proses Sistem

Sistem implementasi algoritma Fuzzy C-Means untuk pengelompokan

sekolah menengah atas di DIY berdasarkan nilai ujian nasional dan nilai sekolah

ini memiliki beberapa tahapan proses. Pertama, pengguna memasukkan data yang


26

akan diolah dalam bentuk file berformat .xls atau .csv. Kedua, pengguna dapat

melakukan seleksi atribut serta melihat distribusi atribut. Seleksi atribut

digunakan untuk memilih atribut tertentu yang akan dihapus. Distribusi atribut

digunakan untuk melihat variasi nilai dalam setiap atribut berserta jumlahnya

dalam bentuk tabel. Tahap kedua ini merupakan tahap pilihan sehingga tidak

harus dikerjakan. Ketiga, pengguna harus memasukkan jumlah cluster (k), jumlah

pembobot(w), maksimum iterasi(i), toleransi kesalahan/Galat(e). Kemudian

sistem akan melakukan proses clustering sesuai dengan algoritma Fuzzy C-Means

sebagai berikut :

1. Membentuk matriks partisi awal keanggotaan (Uik) yg nilai awalnya acak,

i= banyak data, k = banyak kluster(antara0 -1),

2. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut,

3. Menghitung fungsi objektif ,

4. Memodifikasi matriks partisi sebagai berikut.

5. Memeriksa kondisi untuk berhenti,(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter),

Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-2.

6. Menampilkan hasil dari algoritma Fuzzy C-Means berupa fungsi objektif

(Pt), matriks keanggotaan (µik) dan pusat kluster (Vkj).


27

Gambar 3.2 Flowchart Algoritma Fuzzy C-Means

(Kusumadewi,2010).

3.1.5 Output Sistem

Keluaran yang diperoleh dari sistem yang dibangun adalah data-data yang

sudah dikelompokkan dan hasil grafik clustering data sekolah.

Bentuk matriks partisi awal keanggotaan

(Uik) yg nilai awalnya acak, i= banyak

data, k = banyak kluster(antara 0-1)

TIDAK

YA


28

3.1.6 Kebutuhan Perangkat Lunak

Perangkat lunak yang digunakan dalam pembuatan aplikasi ini adalah

Sistem Operasi Windows 7, JDK 1.7, dan NetBeans IDE 7.4.

3.1.7 Kebutuhan Perangkat Keras

Perangkat keras yang digunakan untuk membuat aplikasi ini adalah Laptop

dengan spesifikasi prosessor Intel Core i5, Ram 4 GB, HDD 500 GB.

3.2 Perancangan Sistem

3.2.1 Desain Proses Umum Sistem

Gambar 3.3 Desain Proses buka dan cek berkas input


29

Pada gambar 3.3 diperlihatkan proses dari aplikasi mulai dari membuka

berkas berekstensi .xlx atau .csv kemudian aplikasi akan memeriksa kondisi

berkas, jika berkas .xlx atau .csv sesuai dan format penulisannya benar, maka

aplikasi akan melanjutkan menampilkan ukuran dan jumlah instances yang berada

pada berkas. Namun jika tidak maka aplikasi akan memerintahkan untuk

membuka berkas kembali.Setelah berkas diperiksa langkah selanjutnya adalah

merubah isi berkas ke bentuk array list agar dapat diolah oleh aplikasi.

Gambar 3.4 menunjukkan aplikasi memproses clustering menggunakan

algoritma Fuzzy C-Means. Dimulai dari mengambil array list data yang kemudian

diubah ke bentuk matriks (mxn). Proses selanjutnya adalah memasukkan jumlah

cluster yang diinginkan, banyaknya maksimum iterasi dan galat (batas kesalahan

yang diperbolehkan). Aplikasi kemudian akan mengelompokkan data sesuai

algoritma clustering pada Gambar 3.2, terus berulang sampai didapatkan kondisi

selisih fungsi objektif kurang dari galat (Pt(c) - Pt-1(c) < Eps) atau kondisi iterasi

maksimum sudah terpenuhi.

Secara singkat proses dari clustering dalam aplikasi ini adalah menentukan

centroid atau pusat data secara random dari salah satu titik data yang ada pada

instances, sebanyak jumlah cluster yang diinginkan. Proses kemudian dilanjutkan

dengan perhitungan jarak dari titik instances ke centroid. Perhitungan jarak akan

terus dilakukan untuk mencari jarak terdekat semua titik ke centroid yang ada.

Jika semua data instances sudah terkelompokkan, namun masih ada instance yang

tidak sesuai dengan kelompoknya maka aplikasi akan menentukan centroid baru

dengan mencari rata-rata (mean) jarak instance terhadap centroid yang sudah ada.

Proses akan terus berulang sampai ditemukan jarak yang terdekat sesuai

centroid.Jika iterasi cluster sudah mencapai maksimum, atau data instances sudah

terkelompokkan dengan baik, maka aplikasi akan menampilkan data kelompok

tersebut.

Hasil yang ditampilkan oleh aplikasi adalah hasil clustering berupa poin

cluster dan instances data yang termasuk didalamnya, jumlah iterasi yang telah

dilakukan, fungsi objektif yang dicapai (Pt) , nilai kesalahannya serta grafik

clustering .


30

Gambar 3.4 Desain Proses Clustering Fuzzy C-Means pada aplikasi


31

3.2.2 Diagram Aktivitas (Activity diagram)

Diagram aktivitas digunakan untuk menunjukan aktivitas yang dikerjakan

oleh pengguna dan sistem dalam setiap use case yang disebutkan dalam gambar

3.1 Berikut adalah diagram aktivitas dari setiap use case:

1. Diagram Aktivitas Input Data File .xls, .csv

2. Diagram Aktivitas Seleksi Artibut

3. Diagram Aktivitas Distribusi Atribut

4. Diagram Aktivitas Proses Clustering input k,w,i,e

5. Diagram Aktivitas Lihat grafik plot

6. Diagram Aktivitas Simpan Hasil Proses Clustering

7. Diagram Aktivitas Lihat bantuan

Detail diagram aktivitas dari setiap use case dapat dilihat pada bagian

lampiran diagram aktivitas dalam tugas akhir ini.

3.2.3 Diagram Kelas (Class Diagram)

Gambar 3.5 menggambarkan relasi–relasi terjadi antar kelas, kelas

Praproses ber-relasi asosiasi dengan kelas MenuAwal dan kelas FuzzyC-Means,

relasi asosiasi yang dimaksud adalah kelas MenuAwal memanggil fungsi dari

kelas Praproses untuk menampilkan data input, sedangkan kelas FuzzyC-Means

digunakan kelas Praproses untuk menjalankan proses clustering.


32

Gambar 3.5 Diagram Kelas

3.2.4 Diagram Sekuen (Sequence Diagram)

Pada Gambar 3.6 diperlihatkan diagram sekuen mengenai pembukaan

berkas.

Gambar 3.6 Diagram Sekuen Buka Berkas

Pengguna MenuAwal Praproses

run()

masuk()

pilihBerkas()

requestInput()

InputFile(.xls || .csv)

cekAtribut()

cekAtribut(OK)

tabelPraproses.setEnabled()

showData()


33

Pengguna melakukan perintah run() kepada objek MenuAwal, kemudian

objek MenuAwal akan menjalankan perintah masuk() ke objek Praproses. Pada

objek Praproses tersebut perintah pilihBerkas() dijalankan, return value dari objek

Praproses diterima pengguna berupa request untuk memasukkan berkas.

Pengguna kemudian memasukkan berkas ekstensi .xls atau .csv ke objek

Praproses, yang kemudian menjalankan perintah cekAtribut(), untuk memeriksa

kondisi atribut dalam berkas. Return message dari objek Praproses kemudian

digunakan untuk mengambil path atau alamat dari berkas yang kemudian akan

ditampilkan kepada pengguna dalam bentuk tabel.

Gambar 3.7 Diagram Sekuen Clustering

Diagram Sekuen pada Gambar 3.7 terdapat suatu message connection

antara objek Pengguna, Praproses, FuzzyCMeans dan PlotKlastering. Pesan yang

Pengguna Praproses Fuzzy CMeans PlotKlastering

run()

klastering()

data(OK)

proses(parameter)

matriksAwal()

hitungPusatKlaster()

fObjektif()

matriksUBaru()

tampilHasil()

plot()

scatter(Tabel)

plotKlaster(OK)


34

terjadi dimulai dari Pengguna ketika aplikasi dimulai, objek Pengguna akan

melakukan event meminta run() terhadap Praproses yang kemudian dijawab oleh

objek FuzzyCMeans dengan melakukan klastering(). Setelah mendapatkan return

message data() sudah baik dari objek FuzzyCMeans, maka Pengguna melanjutkan

perintah proses() dengan input parameter klaster, begitu seterusnya sampai pada

akhirnya objek pengguna mendapatkan return message berupa tampilan hasil

analisa clustering dari PlotKlaster.

3.3 Perancangan Antar Muka

Sistem Implementasi algoritma Fuzzy C-Means untuk pengelompokan

Sekolah Menengah Atas di DIY berdasarkan nilai ujian nasional dan nilai sekolah

ini memiliki desain antarmuka yang digunakan untuk melakukan interaksi dengan

pengguna. Antarmuka sistem terdiri dari 6 tampilan yang terdiri dari Halaman

Awal, Halaman Praproses, Halaman Distribusi Atribut, Halaman Fuzzy C-Means,

Halaman Plot Klaster dan Halaman Bantuan.

3.3.1 Halaman Awal

Halaman awal adalah halaman yang digunakan sebagai halaman yang

pertama kali akan muncul ketika aplikasi dijalankan. Halaman ini berisi judul

aplikasi, tombol masuk dan identitas pembuat aplikasi.

Rancangan halaman awal dapat dilihat pada Gambar 3.8 sebagai berikut.

Gambar 3.8 Rancangan Halaman Awal


35

3.3.2 Halaman Praproses

Halaman praproses merupakan halaman yang akan ditampilkan ketika

pengguna menekan tombol masuk pada halaman awal. Halaman ini berfungsi

sebagai sarana pengguna memasukkan data, memeriksa distribusi data dan

menghapus data yang akan di cluster.

Rancangan halaman praproses dapat dilihat pada Gamabr 3.9 sebagai

berikut.

Gambar 3.9 Rancangan Halaman Praproses

3.3.3 Halaman Distribusi Atribut

Halaman distribusi atribut merupakan halaman tambahan yang dapat

digunakan oleh pengguna untuk melihat distribusi atribut dari data yang akan di

cluster. Rancangan dapat dilihat pada gambar 3.10 berikut.


36

Gambar 3.10 Rancangan Halaman Distribusi Atribut

3.3.4 Halaman Fuzzy C-Means

Halaman Fuzzy C-Means ini akan ditampilkan saat pengguna menekan

tombo clustering pada halaman praproses sistem. Halaman ini berfungsi sebagai

sarana pengguna untuk mengatur jumlah cluster (klaster), pembobot, maks Iterasi,

dan Toleransi Error untuk melakukan proses clustering Pada halaman ini

pengguna juga dapat melihat plot hasil clustering serta menyimpan hasil dari

proses clustering. Terdapat menu pilihan untuk proses, ulang, plot, simpan dan

kembali. Rancangan dapat dilihat pada gambar 3.11.


37

Gambar 3.11 Rancangan Halaman Fuzzy C-Means

3.3.5 Halaman Plot Klaster

Rancangan halaman Plot klaster ini digunakan untuk menampilkan hasil

iterasi dan distribusinya pada setiap cluster dalam bentuk grafik tipe XY

(XYSeriresCollection). Rancangannya dapat dilihat pada gambar 3.12 berikut.

Gambar 3.12 Rancangan Halaman Plot Klaster


38

3.3.6 Halaman Bantuan

HalamanBantuan ini ditampilkan saat pengguna menekan tombol Bantuan

di Halaman Utama. Jika ingin keluar dari halaman ini dan kemali ke Halaman

Utama maka pengguna menekan tombol keluar. Halaman Bantuan ini digunakan

untuk menampilkan informasi programmer aplikasi. Rancangannya dapat dilihat

pada gambar 3.13 berikut.

Gambar 3.13 Halaman Bantuan


39

BAB IV

IMPLEMENTASI DAN PENGUJIAN SISTEM

Implementasi sistem merupakan prosedur yang harus dilakukan untuk

menyelesaikan pemrograman sistem berdasarkan pada analisis dan perancangan

sistem pada bab sebelumnya. Impementasi sistem pada aplikasi ini dilakukan

dengan menggunakan tools Netbeans Integrated Development Environment (IDE)

7.4 pada komputer dengan spesifikasi prosessor Intel Core i5, RAM 4 GB, HDD

500 GB. Implementasi sistem pada bab ini terdiri dari implementasi antarmuka

dan implementasi kelas. Sedangkan pada pembahasan sistem terdiri dari

pengujian penggunaan sistem dengan data yang sudah siap untuk diproses

clustering dan hasil pengujian. Daftar nama kelas yang diimplementasikan dalam

sistem ini dapat dilihat pada tabel 5.1 berikut.

Tabel 4.1 Tabel nama kelas yang diimplementasikan

No Nama Kelas Nama Berkas

1 Halaman Awal MenuAwal.java

2 Halaman Praproses Data PraprosesGUI.java

3 Halaman Distribusi Atribut DistribusiAtributGUI.java

4 Halaman Fuzzy C-Means FCMGUI.java

5 Halaman Plot Klaster ScatterAdd.java

6 Halaman Bantuan tProgram.java

7 Model Tabel Tabel.java

8 Model Data Data.java

9 Model Hasil Cetak.java

10 Model Seleksi SeleksiAtribut.java

11 Model Check Box CheckBoxTabelModel.java

12 Write TextArea CostumOutputStream.java

13 Write Excel WriteExcel.java

14 Model Fuzzy C-Means FuzzyCMeans.java


40

4.1 Implementasi Antarmuka

Sistem Pengelompokan Implementasi algoritma Fuzzy C-Means untuk

pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai ujian nasional

dan nilai sekolah telah selesai dibangun, maka pada sub bab ini akan ditampilkan

antarmuka dari sistem tersebut.

4.1.1 Implementasi Halaman Awal

Pada saat aplikasi pertama kali dijalankan akan ditampilkan form awal

seperti ditunjukkan pada Gambar 4.1 berikut.

Gambar 4.1 Antarmuka Halaman Awal

Pada halaman awal tersebut terdapat tombol masuk yang akan mengarah

ke halaman proposes data.

4.1.2 Implementasi Halaman Praproses Data

Halaman ini merupakan halaman yang digunakan untuk mempersiapkan

data yang akan diolah yang berasal dari berkas .xls atau .csv. Pengolahan awal

(praproses) data dimaksudkan agar format data sesuai dengan proses

pengelompokan (clustering) yang akan dilakukan. Format data yang

diperbolehkan dalam algoritma Fuzzy C-Means yaitu data dengan format angka


41

(numerik). Implementasi halaman praproses data ditunjukkan pada Gambar 4.2

berikut.

Gambar 4.2 Antarmuka Halaman Praproses Data

Pengguna kemudian dapat memilih tombol “Pilih Berkas” yang digunakan

untuk memasukkan berkas berekstensi .xls atau .csv. Hasil setelah berkas data

dimasukkan seperti ditunjukkan pada Gambar 4.3 berikut.

Gambar 4.3 Antarmuka Halaman Praproses Data (Berkas .xls atau .csv)


42

Pengguna dapat melakukan seleksi atribut pada tabel atribut, dengan cara

menandai atribut yang ingin dihapus. Atribut yang sudah dilakukan proses hapus

akan hilang dari tabel data. Tampilan penanda hapus atribut seperti ditunjukkan

pada Gambar 4.4 berikut.

Gambar 4.4 Antarmuka Halaman Praproses Data (Hapus Atribut)

4.1.3 Implementasi Halaman Distribusi Atribut

Halaman distribusi atribut digunakan untuk menlihat dan mngetahui

sebaran nilai pada atribut yang dipilih dalam data yang dimasukkan. Halaman ini

akan tampil ketika pengguna memilih tombol “Distribusi Atribut” pada halaman

praproses data. Tampilan halaman distribusi atribut ditunjukkan pada Gambar 4.5

berikut.


43

Gambar 4.5 Antarmuka Halaman Distribusi Atribut

4.1.4 Implementasi Halaman Fuzzy C-Means

Halaman ini merupakan halaman utama dalam sistem implementasi

algoritma Fuzzy C-Means untuk pengelompokan sekolah menengah atas di DIY

berdasarkan nilai ujian nasional dan nilai sekolah (FCM).

Isi dari halaman ini yaitu tampilan data yang sudah dilakukan praproses

data pada kolom data, parameter masukan untuk proses clustering metode FCM

terdapat pada kolom Parameter FCM dan kolom hasil untuk menampilkan hasil

clustering. Tampilan halaman Fuzzy C-Means ditunjukkan pada Gambar 4.6

berikut.

Gambar 4.6 Antarmuka Halaman Fuzzy C-Means


44

Nilai-nilai yang ditampilkan pada kolom parameter FCM, merupakan nilai

default ketika halaman ini ditampilkan. Pengguna dapat merubah nilai-nilai

parameter tersebut dengan menggeser tombol slider, dan nilainya akan

ditampilkan pada textfield yang berada di bawah tombol slider.

Pemberian nilai default pada halaman ini dimaksudkan agar jika pengguna

lupa memasukkan nilai-nilai parameter FCM pada aplikasi maka nilai-nilai default

tersebut yang digunakan sebagai parameter untuk proses clustering.

Pengguna dapat melakukan proses clustering dengan menekan tombol

“Proses”, yang kemudian hasilnya akan ditampilkan pada kolom hasil. Tampilan

hasil clustering seperti ditunjukkan pada Gambar 4.7 berikut.

Gambar 4.7 Antarmuka Halaman Fuzzy C-Means (Clustering)


45

Pengguna juga dapat melakukan operasi simpan hasil clustering, seperti

yang ditampilkan pada kolom hasil kedalam bentuk dokumen berekstensi .xls,.txt

atau .doc.

4.1.5 Implementasi Halaman Plot Clustering

Halaman ini digunakan untuk menampilkan grafik plot setelah proses

clustering selesai dilakukan. Tampilan grafik plot cluster ditunjukkan pada

Gambar 4.8 sebagai berikut.

Gambar 4.8 Antarmuka Halaman Plot Clustering

4.1.6 Implementasi Halaman Bantuan

Halaman bantuan adalah halaman yang akan ditampilkan ketika pengguna

memilih menu petunjuk pada halaman praproses data. Halaman ini berisi

informasi mengenai aplikasi dan petunjuk penggunaan aplikasi.

Tampilan halaman bantuan ditunjukkan pada Gambar 4.9 sebagai berikut.


46

Gambar 4.9 Antarmuka Halaman Bantuan

4.2 Implementasi Kelas

Pada bagian ini terdapat beberapa listing program dari kelas-kelas utama

yang digunakan dalam sistem ini. Method-method yang ditampilkan dari setiap

kelas hanya method yang memuat fungsi utama sistem yang berkaitan dengan

algoritma Fuzzy C-Means.

4.2.1 Implementasi Kelas MenuAwal

Method-method penting yang ada dalam kelas MenuAwal antara lain :

method btnMasukActionPerformed() dan method run(). Penjelasannya sebagai

berikut.


47

Method btnMasukActionPerformed() berisi perintah untuk menjalankan

frame PraprosesGUI jika tombol btnMasuk ditekan. Sedangkan method run()

berisi perintah untuk menjalankan tampilan dialog MenuAwal.

4.2.2 Implementasi Kelas PraprosesGUI

Method-method penting yang ada dalam kelas PraprosesGUI antara lain :

method pilihBerkas(), method distribusiAtribut(), method hapusatribut(), method

method pilihXLS(), pilihCSV() dan cekAtribut(). Penjelasannya sebagai berikut.

Method pilihBerkas() berisi perintah untuk mengarahkan pengguna ke

dialog pilihan berkas yang dijalankan oleh kelas JFileChooser. Setelah pengguna

private void pilihBerkas(){

JFileChooser chooser = new JFileChooser();

int returnVal = chooser.showOpenDialog(null);

if (returnVal == JFileChooser.APPROVE_OPTION) {

String nama_file = chooser.getSelectedFile().getPath();

String[] potong = nama_file.split("\\.");

if (potong[1].equals("xls")) { //FILE EXCEL

pilihXLS(chooser, nama_file);

} else if (potong[1].equals("csv")) { //FILE CSV

pilihCSV(chooser, nama_file);

} else {

JOptionPane.showMessageDialog(null, "File yang dipilih

harus berformat .xls atau .csv");

}

}

}

btnMasukActionPerformed(java.awt.event.ActionEvent evt) {

this.dispose();

PraprosesGUI pg = new PraprosesGUI();

pg.setLocationRelativeTo(null);

pg.setVisible(true);

pg.setExtendedState(pg.MAXIMIZED_BOTH);

}

public void run() {

MenuAwal dialog = new MenuAwal(new javax.swing.JFrame(),

true);

dialog.addWindowListener(new

java.awt.event.WindowAdapter() {

public void windowClosing(java.awt.event.WindowEvent e) {

System.exit(0);

}

});

dialog.setVisible(true);

}


48

memasukkan berkas data, maka nama berkas beserta lokasi penyimpanannya akan

disimpan dalam variable nama_file.

Untuk dapat membaca isi berkas, diperlukan perintah untuk mendeteksi

ekstensi berkas. Jika berkas berekstensi .xls maka method pilihXLS() akan

dijalankan, sedangkan jika berkas berekstensi .csv maka method pilihCSV() akan

dijalankan, namun jika tidak keduanya maka pesan kesalahan akan ditampilkan ke

layar.

Method hapusAtribut() merupakan method yang digunakan untuk

menghapus atribut yang tidak diperlukan pada preproses data input. Algoritma

proses hapus atribut sesuai sintak pada method hapusAtribut() sebagai berikut.

1. Buat objek berupa ArrayList untuk menyimpan data nama-nama atribut

yang telah dipilih untuk dihapus.

private void hapusAtribut() {

List<String> hapus_atribut = new ArrayList<String>();

for (int i = 0; i < ctm.getRowCount(); i++) {

if (ctm.getValueAt(i, 1).equals(true)) {

hapus_atribut.add(ctm.getValueAt(i, 0).toString());

}}

ctm.removeRow();

TableModel model = tabelPraproses.getModel();

int column = model.getColumnCount();

int row = model.getRowCount();

Vector columnNames = new Vector();

Vector data = new Vector();

for (int i = 0; i < ctm.getRowCount(); i++) {

if (!cekAtribut(ctm.getValueAt(i, 0).toString(),

hapus_atribut)) {

columnNames.addElement(ctm.getValueAt(i, 0));

}}

for (int i = 0; i < row; i++) {

Vector rows = new Vector();

for (int j = 0; j < column; j++) {

if (cekAtribut2(model.getColumnName(j).toString(),

columnNames)) {

rows.addElement(model.getValueAt(i, j));

}

}

data.addElement(rows);

}

DefaultTableModel new_model = new

DefaultTableModel(data, columnNames);

tabelPraproses.setModel(new_model);

ctm.removeRow();

}


49

2. Untuk setiap baris tabel hapus atribut, ambil nama atribut dan tambahkan

ke ArrayList.

3. Hapus baris dari tabel hapus Atribut yang telah dipilih .

4. Buat objek vector baru nama kolom, kolom dan baris untuk menyimpan

data kolom dan baris dari tabel hapus atribut.

5. Buat tabel model baru dari vector – vector hasil poin 3, dan set tabel

praproses dengan model baru tersebut.

4.2.3 Implementasi Kelas Distribusi Atribut

Method-method penting yang ada dalam kelas Distribusi Atribut antara

lain: method daftarAtribut() dan pilihAtribut(). Penjelasannya sebagai berikut.


50

Method daftarAtribut() digunakan untuk memberi isi pada komponen

komponen combo box pilihan atribut yang ingin dilihat distribusinya yang berasal

dari paramenter method List daftarAtribut.

Sedangkan method pilihAtribut() digunakan untuk menampilkan isi tabel

ditribusi atribut. Algoritma proses distribusi atribut sesuai sintak pada method

pilihAtribut() sebagai berikut.

1. Ambil nilai String dari combobox pilih atribut.

2. Buat objek berupa ArrayList untuk menyimpan data record dari atribut.

3. Filter record baris isi atribut dengan membuat List menjadi HashSet

private void daftarAtribut(List<String> daftarAtribut, JTable

tabel) {

model = tabel;

for (int i = 0; i < daftarAtribut.size(); i++) {

comboAtribut.addItem(daftarAtribut.get(i).toString());

}

}

private void pilihAtribut() {

String pilihAtribut =

comboAtribut.getSelectedItem().toString();

String[] columnName = new String[2];

String[][] data = null;

List<String> listData = new ArrayList<String>();

for (int i = 1; i < model.getColumnCount(); i++) {

if

(pilihAtribut.equalsIgnoreCase(model.getColumnName(i).toString(

))) {

columnName[0] = model.getColumnName(i).toString();

columnName[1] = "Jumlah";

for (int j = 0; j < model.getRowCount(); j++) {

listData.add(model.getValueAt(j, i).toString());

}

HashSet hashSet = new HashSet(listData);

listData.clear();

listData = new ArrayList(hashSet);

data = new String[listData.size()][2];

for (int k = 0; k < listData.size(); k++) {

for (int l = 0; l < model.getRowCount(); l++) {

if (listData.get(k).toString().

equalsIgnoreCase(model.getValueAt(l,

i).toString())) {

setCount(count + 1); }}

data[k][0] = listData.get(k).toString();

data[k][1] = String.valueOf(getCount());

setCount(0); } } }

DefaultTableModel d = new DefaultTableModel(data,

columnName);

tabelDistribusi.setModel(d); }


51

4. Counter isi dari record dari ArrayList untukmenegtahui banyak record.

5. Buat array bertipe String untuk menyimpan data hasil poin 3 dan 4.

Buat tabel model baru dan isi dengan array dari poin 5 untuk menampilkan

isi tabel distribusi.

4.2.4 Implementasi Kelas Fuzzy C-Means

Kelas Fuzzy C-Means merupakan kelas utama pada sistem ini. Kelas ini

berisi sintak-sintak algoritma Fuzzy C-Means yang dibagi menjadi 7 methods,

antara lain: method konstruktor FuzzyCMeans(), method matriksAwal(), method

hitungPusatKlaster(), method fObjektif(), matriksUBaru(), method getMaxValue()

dan method tampilHasil(). Penjelasannya sebagai berikut.

Method kontsruktor adalah method yang akan dijalankan bersamaan

dengan dipanggilnya kelas FuzzyCMeans. Parameter yang melekat pada method

konstruktor, kemudian digunakan oleh method lain sebagai variabel maupun

objek dalam proses clustering. Sedangkan method-method utama untuk proses

clustering, dapat dilihat pada sintaks berikut.

public class FuzzyCMeans {

……..

//fungsi konstruktor dengan parameter k,w,dan input

public FuzzyCMeans(int k, int w, double[][] input) {

this.k = k; this.w = w;

this.input = input;

//ambil nilai baris dan kolom dari var input

baris = input.length; kolom = input[0].length;

//inisialisasi var objektif sebanyak baris data input

objektif = new double[baris];

}

//fungsi untuk menghitung pusat klaster

public double[][] hitungPusatKlaster(){

double[] jumU = new double[k];

double[][] hitungUW = new double[baris][k];

for (int i=0;i<baris;i++){

for (int j=0;j<k;j++){

hitungUW[i][j]=Math.pow(matriksU[i][j],w);

//var jumU untuk menyimpan jumlah dari var

hitungUW

jumU[j] += hitungUW[i][j];

}

}

System.out.println("");

//var df untuk format penulisan dua angka dibelakang

koma

df = new DecimalFormat("###.###");

// for (int i=0;i<baris;i++){

// for (int j=0;j<k;j++){

//

System.out.print(df.format(hitungUW[i][j])+"\t");

// }

// System.out.println("");

// }


52

//fungsi untuk membuat matriks keanggotaan di awal secara acak

public double[][] matriksAwal(){

//barisnya sebanyak data input dan kolomnya sebanyak jumlah

klaster

matriksU = new double[baris][k];

Random generator = new Random();

//membuat random nilai dengan nilai desimal (1

dibelakang koma)



matriksU[i][j] =

Math.round(generator.nextDouble()*100.0)/100.0;

}

}

//cetak matrik keanggotaan

System.out.println("Matrik U awal : ");



System.out.print(matriksU[i][j] +"\t");

}


}

return matriksU;

}

//fungsi untuk menghitung pusat klaster

public double[][] hitungPusatKlaster(){

double[] jumU = new double[k];

double[][] hitungUW = new double[baris][k];



//var hitung menyimpan pemangkatan matriks

keanggotaan dengan pembobot w

hitungUW[i][j]=Math.pow(matriksU[i][j],w);

//var jumU untuk menyimpan jumlah dari var

hitungUW

jumU[j] += hitungUW[i][j];

}

}


//instansiasi var v untuk menyimpan pusat klaster

v = new double[k][kolom];

double[][] sem = new double[k][kolom];

for (int i=0; i<baris;i++){ //panjang baris matrik input

for (int j=0; j<k;j++){ //panjang kolom matrik

keanggotaan

for(int l=0;l<kolom;l++){ //panjang kolom matrik

input

//var sem digunakan untuk menyimpan sementara jumlah

perhitungan (Uik^w) * (Xij), excel baris 30

sem[j][l] += (hitungUW[i][j]*input[i][l]);

}

//System.out.println();

}

//System.out.println();

for (int j=0; j<k;j++){ //panjang baris matrik

input

for(int l=0;l<kolom;l++){ //panjang kolom

matrik keanggotaan

//pusat klasternya, excel baris 39

v[j][l] = sem[j][l]/jumU[j];

//System.out.print(v[j][l]+" ");

}


53

…

//cetak pusat klaster

System.out.println("Pusat Kluster = ");

for (int i=0;i<k;i++){

for (int j=0;j<kolom;j++){

System.out.print(df.format(v[i][j])+"\t");

}

System.out.println();

}


return v;

}

//fungsi menghitung fungsi objektif

public double fObjektif(){

totalP = new double[baris][v.length];

double[][] semP = new double[baris][v.length];

double Pbaru = 0;

System.out.println("Fungsi Objektif = ");


for (int j=0;j<v.length;j++){

for (int l=0;l<v[0].length;l++){

//var totalP menyimpan jumlah (Xij-Vkj)^2,

excel baris 52

totalP[i][j] += Math.pow((input[i][l]-

v[j][l]),2);

}

//var semP untuk meyimpan hasil perkalian

(Uik^w * P)

semP[i][j] = totalP[i][j] *

Math.pow(matriksU[i][j], w);

objektif[i] += semP[i][j];

//System.out.print(semP[i][j]+"\t");

}

//var Pbaru untuk menyimban fungsi objektif baru

Pbaru += objektif[i];

//System.out.println("");

}

System.out.println(Pbaru);


return Pbaru;

}

//fungsi untuk membuat matriks keanggotaan baru

public double[][] matriksUBaru(){

double pemangkat = -1/(w-1);

double[] jum = new double[baris] ;

double[][] UBaru = new double[baris][k];

df = new DecimalFormat("###.###");

System.out.println("Matriks U Baru = ");



//var jum untuk menyimpan jumlah matriks keanggotaan yg

dipangkatkan

jum[i] += Math.pow(totalP[i][j], pemangkat);

//System.out.print(Math.pow(totalP[i][j],

pemangkat)+"\t");

}


//var Ubaru menyimpan nilai untuk matriks

keanggotaan yang baru hasil pembagian totalP/jum, excel baris

61 (pink)

UBaru[i][j] = Math.pow(totalP[i][j],


54

jum[i] += Math.pow(totalP[i][j], pemangkat);

}


//var Ubaru menyimpan nilai untuk matriks keanggotaan yang baru

hasil pembagian totalP/jum

UBaru[i][j] = Math.pow(totalP[i][j],

pemangkat)/jum[i];

System.out.print(df.format(UBaru[i][j])+"\t");

}


}

matriksU = UBaru;

return matriksU;

}

// mendapatkan nilai maksimal dari data array

public Data getMaxValue(Data[] listdata){

Data maxValue = listdata[0];

for(int i=1;i < listdata.length;i++){

if(listdata[i].getIsi() > maxValue.getIsi()){

maxValue = listdata[i];

}

}

return maxValue;

}

//menampilkan hasil ke teks area/console sistem

public Tabel[] tampilHasil(double[][] hasil,Tabel[] t){

System.out.println("Hasil Klaster data sebagai berikut : ");

Data [] listdata = new Data[hasil[0].length];

Integer [] klaster = new Integer[hasil.length];

Data akhir;

for (int i=0;i<hasil.length;i++){

for (int j=0;j<hasil[0].length;j++){

Data sem = new Data();

sem.setPosisi(j+1);

sem.setIsi(hasil[i][j]);

listdata[j]=sem;

}

akhir = getMaxValue(listdata);

klaster[i]=akhir.getPosisi();

}

for(int i=0;i<klaster.length;i++){

t[i].setPosisi(""+klaster[i]);

}

ArrayList<Integer> b = new ArrayList<>();

Collections.addAll(b, klaster);

for(int i=1;i<=hasil[0].length;i++){

System.out.println("Banyak Klaster "+i+" =

"+Collections.frequency(b,i));

System.out.println("Isi Klaster "+i+" = ");

if(Collections.frequency(b,i)!=0){

for (Tabel t1 : t) {

if (Integer.parseInt(t1.getPosisi()) == i)

{

System.out.println("Data ke-

"+t1.getNo()+"\t"+t1.getNama());

}

}


}else{

System.out.println("-");

}

}


55

4.2.5 Implementasi Kelas ScatterAdd

Kelas ScatterAdd merupakan kelas yang digunakan untuk menampilkan

grafik plot clustering. Method – method yang ada didalam kelas ini antara lain:

method konstruktor ScatterAdd(), method createPanel() dan method createData().

Method konstruktor berisi parameter jdudl dan objek dari kelas Tabel

berisi hasil clustering. Sedangkan method createData() berfungsi untuk

mengkonversikan objek array data menjadi list, kemudian dijadikan parameter

untuk kelas pembentuk grafik tipe XY (XYSeriresCollection).

Method createPanel() berfungsi sebagai eksekutor grafik plot clustering

yang memanggil kelas JFreeChart, sebagai kelas pembentuk grafik plot. Return

value dari method ini kemudian dikirimkan ke kelas ChartPanel untuk

ditampilkan ke pengguna dalam bentuk grafik.

public class ScatterAdd extends JFrame {

private XYSeries added = new XYSeries("Data Sekolah"); private String title; public ScatterAdd(String s,Tabel[] ctk) { this.title=s; final ChartPanel chartPanel = createPanel(); this.add(chartPanel, BorderLayout.CENTER); for (Tabel ctk1 : ctk) {

added.add(Integer.parseInt(ctk1.getNo()),

Integer.parseInt(ctk1.getPosisi())); }

} private ChartPanel createPanel() { JFreeChart jfreechart = ChartFactory.createScatterPlot( title, "", "Klaster", createData(), PlotOrientation.VERTICAL, true, true, false); XYPlot xyPlot = (XYPlot) jfreechart.getPlot(); xyPlot.setDomainCrosshairVisible(true); xyPlot.setRangeCrosshairVisible(true); XYItemRenderer renderer = xyPlot.getRenderer(); renderer.setSeriesPaint(0, Color.blue); NumberAxis domain = (NumberAxis)

yPlot.getDomainAxis(); domain.setVerticalTickLabels(true); NumberAxis range = (NumberAxis) xyPlot.getRangeAxis(); range.setTickUnit(new NumberTickUnit(1));

return new ChartPanel(jfreechart); }


56

4.2.6 Implementasi Kelas tProgram

Kelas tProgram merupakan kelas yang mengimplementasikan halaman

bantuan. Kelas ini berisi komponen utama objek dari kelas URL yang berisi

alamat lokasi berkas bantuan bernama aplikasi.rtf, JTextPanel sebagai wadah

(container) tempat berkas bantuan ditampilkan. Berikut sintak yang ada dalam

kelas tProgram.

4.3 Pengujian Sistem

Pengujian terhadap sistem ini meliputi metode pengujian, yaitu pengujian

blackbox dan pengujian implementasi algoritma Fuzzy C-Means (FCM).

Pengujian blackbox adalah pengujian perangkat lunak dari aspek

fungsional dengan tidak memperhatikan struktur internal dari perangkat lunak

yang diuji. Pengetahuan khusus mengenai struktur internal dan pemrograman

pada umumnya tidak diperlukan dalam pengujian blackbox. Pengujian blackbox

dilakukan untuk mengetahui apakah sebuah perangkat lunak sudah berfungsi

sesuai dengan yang diharapkan pengguna.

public tProgram() {

try{

url=getClass().getResource("/Komponen/aplikasi.rtf");

initComponents();

jTextPane1.setEditable(false);

jTextPane1.setPage(url);

} catch (IOException ex) {

System.out.println("File tidak dapat dibuka");

}

}

…

private XYDataset createData() { XYSeriesCollection xySeriesCollection = new XYSeriesCollection(); xySeriesCollection.addSeries(added); return xySeriesCollection; } }


57

Pengujian implementasi algoritma FCM dilakukan dengan

membandingkan hasil cluster(klaster) yang diperoleh melalui sistem dengan hasil

cluster melalui perhitungan manual dan metode FCM dari tools Matlab.

4.3.1 Pengujian Blackbox

Berikut tabel 4.2 yang menunjukkan hasil pengujian blackbox pada sistem.

Berikut tabel 4.2 yang menunjukkan hasil pengujian blackbox pada aplikasi.

Tabel 4.2 Tabel Hasil Pengujian Blackbox

No Interface Keterangan

1 Halaman Awal Sudah berjalan dengan baik, tombol masuk berjalan

sesuai dengan fungsinya.

2 Halaman

Praproses

Sudah berjalan dengan baik, pesan kesalahan sudah

muncul jika berkas yang dimasukkan bukan berekstensi

.xls atau .csv.

Tombol Distribusi Atribut, Hapus Atribut dan Klastering

sudah berjalan sesuai fungsinya.

Tabel Hapus atribut dapat diberikan pilihan dan ketika

proses hapus atribut dipilih, tabel data dan tabel hapus

sudah berubah sesuai atribut yang tidak dihapus.

3

Halaman

Distribusi

Atribut

Sudah berjalan dengan baik menampilkan pilihan atribut

yang ingin dilihat distribusinya pada combobox.

Tabel distribusi atribut sudah secara benar menampilkan

banyaknya record dari atribut.

4 Halaman Fuzzy

C-Means

Sudah berjalan dengan baik, menampilkan data dari

halaman praproses.

Pemberian parameter FCM dapat berjalan dengan baik

dengan menggeser slider dan nilai ditampilkan pada field

parameter

Proses klastering berjalan dengan baik, dan hasil klaster

ditampilkan di teksarea klaster.

Tombol proses,ulangi,plot dan kembali sudah berjalan


58

sesuai fungsinya.

Tombol simpan sudah dapat menyimpan dalam

format.xls, .txt dan .doc

5 Halaman Plot

Klaster

Sudah memunculkan plot xy klaster data dan klaster,

namun belum dapat memberikan pembedaan warna data

klaster sesuai klaster.

6 Halaman

Bantuan

Sudah bekerja baik, muncul teks petunjuk pemakaian

aplikasi.

4.3.2 Pengujian Validitas Implementasi Algoritm FCM

Pengujian validitas implementasi algoritma FCM dimaksudkan untuk

mengetahui apakah algoritma FCM sudah diimplementasikan secara benar sesuai

dengan dasar teori algoritma FCM. Pengujian dilakukan dengan cara melakuakan

perbandingan hasil uji sistem dengan perhitungan manual dan uji pada tools

Matlab.Data uji menggunakan data yang sudah siap untuk diproses clustering.

Data uji yang digunakan secara manual dan sistem yakni dengan banyak

data sejumlah 3 atribut dan 10 record, dicuplik dari data ujian nasional sekolah

menengah atas di DIY. Berikut contoh input data yang digunakan sebagai bahan

uji ditunjukkan pada tabel 4.3. Sedangkan data untuk uji matlab menggunakan

data IPA tahun 2011, cuplikan terdapat pada lampiran.

Tabel 4.3 Tabel Data Uji Algoritma FCM

No Nama Sekolah ING MAT BIO

1 SMA NEGERI 3 YOGYAKARTA 8.73 8.40 8.20

2 SMA NEGERI 1 BANTUL 8.14 8.32 8.31

3 SMA PATRIA BANTUL 4.00 2.63 4.53

4 SMA SANTO THOMAS

YOGYAKARTA 5.80 3.75 4.38

5 SMA NEGERI 1 SLEMAN 8.29 7.85 7.81

6 SMA NEGERI 1 YOGYAKARTA 8.47 8.14 7.95

7 SMA MUHAMMADIYAH SEWON 5.58 3.52 4.52

8 SMA PEMBANGUNAN 2

KARANGMOJO 4.55 2.96 4.66

9 SMA MUHAMMADIYAH WATES 3.93 2.97 4.69

10 SMA PEMBANGUNAN 3 PONJONG 5.19 3.52 5.05


59

4.3.2.1 Pengujian Algoritma FCM pada Sistem

Hasil pengujian pada sistem setelah data input dilakukan praproses data,

kemudian diberikan input parameter FCM berupa: jumlah klaster = 2, pemangkat

= 2, maksimum iterasi = 100 dan toleransi error = 0.001. Hasil pengujian

ditunjukkan pada Gambar 4.10 sebagai berikut.

Gambar 4.10 Pengujian Algoritma FCM pada Sistem


60

Cuplikan hasil pengujian pada Gambar 4.10 sebagai berikut.

Iterasi ke-6 :

==============================

Pusat Kluster =

4.836 3.222 4.641

8.406 8.176 8.066

Fungsi Objektif = 4.8558649415505215

Matriks U Baru =

0.003 0.997

0.003 0.997

0.983 0.017

0.969 0.031

0.004 0.996

0 1

0.985 0.015

0.997 0.003

0.985 0.015

0.991 0.009

Banyak Data = 10

************************************

Hasil Klaster data sebagai berikut :

Banyak Klaster 1 = 6

Isi Klaster 1 =

Data ke-3 SMA PATRIA BANTUL

Data ke-4 SMA SANTO THOMAS YOGYAKARTA

Data ke-7 SMA MUHAMMADIYAH SEWON

Data ke-8 SMA PEMBANGUNAN 2 KARANGMOJO

Data ke-9 SMA MUHAMMADIYAH WATES

Data ke-10 SMA PEMBANGUNAN 3 PONJONG

Banyak Klaster 2 = 4

Isi Klaster 2 =

Data ke-1 SMA NEGERI 3 YOGYAKARTA

Data ke-2 SMA NEGERI 1 BANTUL

Data ke-5 SMA NEGERI 1 SLEMAN

Data ke-6 SMA NEGERI 1 YOGYAKARTA

************************************

Banyak Iterasi = 6

Error Fungsi Obyektif = 4.981817772353736E-5

Waktu Klastering = 0.208 detik


61

Cuplikan hasil pengujian pada sistem menunjukkan bahwa sistem dapat

mengelompokkan data uji secara baik setelah 6 (enam) iterasi, dengan kesalahan

fungsi obyektif sebesar 4.981817772353736E-5 dengan waktu 0.208 detik.

Perbandingan implementasi algoritma FCM dilakukan dengan

membandingkan implementasi dan uji algoritma FCM pada perhitungan manual

dengan tools Microsoft Excel dan uji metode FCM pada tools Matlab dengan data

uji yang sama dengan pengujian algoritma FCM pada sistem.

4.3.2.2 Pengujian Perbandingan Hasil Secara Manual dan Sistem

Data uji yang digunakan merupakan data sampel nilai ujian nasional dan

niali sekolah pada tahun 2011. Pengujian pada data uji dimaksudkan untuk

mengetahui apakah sistem dapat mengelompokkan sekolah sesuai dengan data uji.

Tabel data uji secara manual dan sistem ditunjukkan pada tabel 4.4 dan data uji

pada matlab dan sistem terdapat pada lampiran, sebagai berikut.

Tabel 4.4 Sampel Data Uji Secara Manual dan Sistem

Data Variabel

ING MAT BIO

SMA NEGERI 3 YOGYAKARTA 8.73 8.40 8.20

SMA NEGERI 1 BANTUL 8.14 8.32 8.31

SMA PATRIA BANTUL 4.00 2.63 4.53

SMA SANTO THOMAS YOGYAKARTA 5.80 3.75 4.38

SMA NEGERI 1 SLEMAN 8.29 7.85 7.81

SMA NEGERI 1 YOGYAKARTA 8.47 8.14 7.95

SMA MUHAMMADIYAH SEWON 5.58 3.52 4.52

SMA PEMBANGUNAN 2 KARANGMOJO 4.55 2.96 4.66

SMA MUHAMMADIYAH WATES 3.93 2.97 4.69

SMA PEMBANGUNAN 3 PONJONG 5.19 3.52 5.05

Setelah dilakukan pengujian pada sistem dibandingkan dengan manual

didapatkan hasil perbandingan hasil implementasi algoritma FCM seperti

ditunjukkan pada tabel 4.5 dan table 4.6 sebagai berikut.


62

Tabel 4.5 Uji Perbandingan Algoritma FCM Secara Manual dan Sistem

No Uji Sistem M. Excel

1 Jumlah data 10 10

2 Jumlah Iterasi 4 6

3 Fungsi Obyektif 4.855 4.86

4 Error FObyektif 0.008328 0.00

5 Member klaster 1 6 6

6 Member klaster 2 4 4

Tabel 4.6 Hasil uji perbandingan member percluster secara manual dan

sistem

Sistem Manual

klaster

1

SMA PATRIA BANTUL

SMA SANTO THOMAS YOGYAKARTA

SMA MUHAMMADIYAH SEWON

SMA PEMBANGUNAN 2 KARANGMOJO

SMA MUHAMMADIYAH WATES

SMA PEMBANGUNAN 3 PONJONG

SMA PATRIA BANTUL






Klaster

2

SMA NEGERI 3 YOGYAKARTA

SMA NEGERI 1 BANTUL

SMA NEGERI 1 SLEMAN



SMA NEGERI 1 BANTUL

SMA NEGERI 1 SLEMAN


Kesimpulan hasil perbandingan metode FCM secara manual dan dengan

sistem yaitu bahwa sistem telah dapat mengimplementasikan algoritma FCM

dengan baik, dengan menghasilkan jumlah dan data member klaster yang sama

dengan perhitungan manual .

Untuk melihat lebih lanjut hasil perhitungan manual lihat pada Lampiran

Hasil manual.

4.3.2.3 Pengujian Perubahan Nilai Galat(e) dan Maksimal Iterasi(i)

Pengujian terhadap sistem implementasi Algoritma Fuzzy C-Means dapat

dilakukan dengan mengubah nilai Galat ( e) dan maksimal Iterasi (i) . Berikut

beberapa hasil uji clustering .


63

Di uji dengan data IPA 2013 dengan,

a. Jumlah data uji 137 sekolah,

b. Jumlah data atribut 12 terdiri dari nilai UN B.ind, B.ing,

Matematika, Fisika, Kimia, Biologi dan NS atribut B.ind, B.ing,

Matematika, Fisika, Kimia, Biologi

c. Jumlah klaster (k) = 3 , pemangkatam pembobot (w)= 2

Menghasilkan perbedaan hasil setelah melakukan 5 kali percobaan,seperti

dibawah ini :

Tabel 4.7 Uji perubahan nilai Galat ( e) dan maksimal Iterasi (i)

Maksimal iterasi(i) 5 9 13 21 100 G A

L ( e ) A T

0.1 5 5 5 5 5

0.01 5 5 5 5 5

0.001 5 5 5 5 4

0.0001 5 5 5 5 3

0.00001 5 5 4 2 1

Dari hasil percobaan diatas, dapat disimpulkan bahwa,

a. jika semakin kecil Galat(e) yaitu 0.00001 dan maksimal iterasi semakin

besar yaitu 100 maka akan menghasilkan 1 macam hasil dari proses

clustering, dengan kata lain menghasilkan jumlah anggota cluster yang

konsistensinya tinggi dan hasilnya akan semakin serupa dengan hasil yang

diuji dengan matlab

b. jika semakin besar Galat(e) yaitu 0.1 dan maksimal iterasi semakin kecil

yaitu 5 maka akan menghasilkan 5 bahkan lebih macam hasil dari proses

clustering bila melakukan uji lebih dari 5, dengan kata lain menghasilkan

jumlah anggota cluster yang konsistensinya rendah dan hasilnya akan

semakin kurang akurat dalam mengelompokkan data sehingga hasil uji

dari sistem akan berdeda dari hasil uji matlab.

Untuk melihat lebih lanjut rincian hasil percobaan, lihat pada Lampiran uji

perubahan nilai Galat dan maksimal Iterasi(i)


64

4.3.2.4 Pengujian Perbandingan Hasil Sistem dengan Matlab

Kemudian dilakukan pengujian pada sistem dibandingkan matlab dengan

file yang berisi data nilai 6 mata pelajaran ujian nasional dan 6 mata pelajaran

ujian sekolah IPA tahun 2011 dengan maksimal iterasi 100 dan nilai Galat =

0,00001 , maka hasil perbandingan hasil implementasi algoritma FCM seperti

ditunjukkan pada tabel 4.8 dan tabel 4.9 sebagai berikut.

Tabel 4.8 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem

No Uji Sistem Matlab

1 Jumlah data 134 134


3 Jumlah Member

klaster 1 54 54

4 Jumlah Member

klaster 2 32 32

5 Jumlah Member

klaster 3 48 48

Tabel 4.9 Hasil uji perbandingan member percluster nilai ujian nasional, nilai

sekolah


65


66


67


68

Kemudian dilakukan pengujian pada sistem dibandingkan matlab dengan

data nilai 6 mata pelajaran ujian nasional IPA tahun 2011 dengan maksimal iterasi

100 dan nilai Galat = 0,00001, maka hasil perbandingan hasil implementasi

algoritma FCM seperti ditunjukkan pada tabel 4.10 dan tabel 4.11 sebagai berikut





3 Jumlah Member

klaster 1 50 50

4 Jumlah Member

klaster 2 54 54

5 Jumlah Member

klaster 3 30 30

Tabel 4.11 Hasil uji perbandingan member percluster nilai ujian nasional


69


70


71

Kemudian dilakukan pengujian pada sistem dibandingkan dengan matlab

dengan file yang berisi data nilai 6 mata pelajaran ujian sekolah IPA tahun 2011

dengan maksimal iterasi 100 dan nilai Galat = 0,00001, maka hasil perbandingan

hasil implementasi algoritma FCM seperti ditunjukkan pada tabel 4.12 dan tabel

4.13 sebagai berikut





3 Jumlah Member

klaster 1 48 48

4 Jumlah Member

klaster 2 59 59

5 Jumlah Member

klaster 3 27 27

Tabel 4.13 Hasil uji perbandingan member percluster nilai ujian sekolah


72


73


74

Kesimpulan hasil perbandingan algoritma FCM matlab dengan sistem

yaitu bahwa sistem telah dapat mengimplementasikan metode FCM dengan valid,

dengan menghasilkan jumlah dan data member klaster yang sama dengan

perhitungan matlab.

Untuk melihat lebih lanjut screenshot gambar hasil percobaan, lihat pada

Lampiran gambar screenshot hasil uji matlab dan sistem.


75

Tabel 4.14 Hasil uji perbandingan hasil jumlah member percluster

Hasil table 4.7 Hasil table 4.9 Hasil table 4.11

Jumlah Anggota

Cluster 1 54 50 48

Jumlah Anggota

Cluster 2 32 54 59

Jumlah Anggota

Cluster 3 48 30 27

Pada table 4.14 dapat dilihat perbandingan hasil dari ketiga percobaan

tersebut, yang menghasilkan jumlah anggota member cluster yang berbeda

perclusternya dalam 3 data inputan uji coba yang berbeda. Hal ini dikarenakan

inputan data yang diuji memiliki nilai yang berbeda-beda. Untuk melihat rincian

perbandingan hasil anggota percluster dari table 4.9, 4.11, dan 4.13 dapat dilihat

pada lampiran table perbandingan detail table 4.14.

4.4 Kelebihan dan Kekurangan Sistem

Sistem yang dibangun ini memiliki kelebihan dan kekurangan. Berikut

adalah kelebihan dan kekurangan dari sistem.

4.4.2 Kelebihan Sistem

1. Sistem dapat membaca input data yang berasal dari berkas dengan

format .xls dan .csv .

2. Sistem dapat melakukan seleksi atribut atau kolom terhadap data yang

diinputkan oleh pengguna.

3. Sistem dapat menyimpan hasil cluster (klaster) ke dalam berkas

dengan format .xls,.txt dan .doc.

4. Sistem dapat menampilkan grafik plot klaster.


76

4.4.3 Kekurangan Sistem

1. Sistem tidak dapat membaca input data berupa file dengan format

selain .xls dan .csv .

2. Sistem tidak dapat menampilkan data statistik selain distribusi data

(mean,median,range, maksimum, minimum) pada data input.

3. Sistem tidak dapat melakukan seleksi dan hapus baris terhadap data

yang diinputkan pengguna.


77

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Kesimpulan yang diperoleh sebagai hasil penyelesaian tugas akhir ini

adalah:

1. Implementasi algoritma Fuzzy C-Means untuk pengelompokan Sekolah

Menengah Atas di DIY berdasarkan nilai Ujian Nasional dan nilai sekolah

telah berhasil dibangun dan dapat digunakan untuk pengelompokan

Sekolah Menengah Atas di DIY .

2. Metode Clustering dengan algoritma Fuzzy C-Means terbukti dapat

mengelompokkan data sekolah dengan valid.

5.2 Saran

Berdasarkan hasil analisis pada tugas akhir ini, penulis memberikan saran

untuk perbaikan dan pengembangan program lebih lanjut antara lain:

1. Program yang dibangun ini belum bisa menerima masukan selain berkas

berformat .xls, .csv. Sistem ini bisa dilengkapi dengan tambahan pembaca

data dari format lain contohnya seperti .doc.

2. Program dapat menampilkan data statistik selain distribusi atribut yaitu

mean, median, range, maksimumdan minimum.

3. Program dapat menampilkan grafik selain hasil klaster yaitu grafik iterasi,

grafik fungsi objektif dan grafik error fungsi objektif.


78

DAFTAR PUSTAKA

Asih, Wening Tyas. 2008. Aplikasi Program Pengelompokan Penduduk

Berdasarkan Kemampuan Ekonomi untuk Daerah Miskin dengan Fuzzy C-

Means.Universitas Sanata Dharma.

Dunham, Margareth H. 2003. Data Mining Introductory and Advanced

Topics.New Jersey: Prentice Hall.

Ernawati, Susanto. 2009. Pembagian Kelas Peserta Kuliah Berdasarkan Fuzzy

Clustering dan Partition Coefficient and Exponential Separation Index .

Universitas Atma Jaya.

Hadi HY. 2005. Pembagian Kelas Kuliah Mahasiswa Menggunakan Algoritma

Pengklasteran Fuzzy. Universitas Diponegoro.

Hair et al. 1998. Multivariate Data Analysis, Fifth Edition.Upper Saddle River :

New Jersy.

Han, Jiawei & Kamber, Micheline. 2006. Data Mining: Concepts and Techniques

2nd ed. San Francisco, CA: Morgan Kaufmann Publishers.

Kantardzic, M. 2003. Data Mining Concepts Models, Methods, and Algorithms.

New Jersey: IEEE.

Kusumadewi, S. dan Purnomo, H. 2010. Aplikasi Logika Fuzzy untuk Pendukung

Keputusan edisi 2. Yogyakarta: Graha Ilmu.

Luthfi , Emha Taufiq. 2007. Fuzzy C-Means Untuk Clustering Performance

Mengajar Dosen. STMIK AMIKOM .

Roger S. Pressman, 2002. Rekayasa Perangkat Lunak Pendekatan Praktisi (Buku

Satu): ANDI Yogyakarta.

Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis.

Yogyakarta:GrahaIlmu.

Sudjana, Nana. 2001. Penilaian hasil proses belajar mengajar. Bandung: Remaja

Rosdakarya.

Wahyuni et al. 2009. Penggunaan Cluster-Based Samplinguntuk Penggalian

Kaidah Asosiasi Multi Obyektif. Institut Teknologi Nasional Malang

Yehuda, Aditya Nur Santoso. 2012. Penerapan Algoritma Fuzzy C-means untuk

Clustering Objek Wisata.Universitas Kristen Satya Wacana.


http://repository.uksw.edu/browse?type=author&value=Aditya+Nur+Santoso%2C+Yehuda

79

LAMPIRAN

LAMPIRAN TABEL RINGKASAN USECASE

Tabel Deskripsi Use Case

Nomor Nama Use Case Deskripsi Aktor

Use Case

FC-001 Input data file .xls, Use case ini menggambarkan proses Pengguna .csv input data, dalam bentuk file .xls,

.csv yang akan digunakan untuk proses

clustering

FC-002 Seleksi atribut Use case ini menggambarkan proses seleksi atribut dari data yang Pengguna

diinputkan, sehingga atribut yang

Tidak diperlukan dapat dihapus.

FC-003 Distribusi atribut Use case ini menggambarkan proses Pengguna distribusi atribut dari data yang

diinputkan

FC-004 Proses clustering Use case ini menggambarkan proses Pengguna

input k,w,i,e Clustering dalam data yang telah

diinputkan

FC-005 Lihat grafik plot Use case ini menggambarkan grafik Pengguna

Hasil dari proses clustering

FC-006 Simpan hasil Use case ini menggambarkan proses Pengguna proses clustering simpan hasil pencarian clustering ke

dalam file .xls, .txt atau .doc

FC-007 Lihat bantuan Use case ini untuk melihat petujuk Pengguna bagaimana cara kerja dari sistem ini


80

LAMPIRAN DIAGRAM AKTIFITAS (ACTIVITY DIAGRAM)

Diagram Aktivitas

1. Input data file .xls, .csv

Pengguna Sistem

Menekan tombol

pilih berkas

Menampilkan

JFileChooser

Memilih file .xls

atau .csv

Membaca data yang dipilih lalu menampilkannya pada tabel data beserta jumlahnya dan daftar nama atribut


81

2. Proses clustering

Pengguna Sistem

Menekan tombol

Klastering

Menampilkan halaman

FCMGUI dan menampilkan

data yang telah dipilih inputan

pada tabel

Mengeset jumlah k,w,I,e

Menekan tombol Proses

Menampilkan hasi clustering

pada teks area FCMGUI


82

3. Simpan Hasil Clustering

4. Seleksi Atribut


83

5. Distribusi Atribut

Pengguna Sistem

6. Melihat plot

Menekan tombol

Distribusi Atribut

Menampilkan

DistribusiAtributGUI

Memilih nama atribut

dari daftar atribut

Menampilkan detail isi

atribut


84

7. Melihat Bantuan


85

LAMPIRAN DIAGRAM KONTEKS

Gambar Diagram Konteks


86

LAMPIRAN UJI PERUBAHAN NILAI GALAT(e), DAN MAKSIMAL

ITERASI (i)

Sebagian Rincian percobaan pada tabel 4.7

Dilakukan percobaan 5 kali uji,

Percobaan 1, dengan Galat (e) = 0,1

i=5 i=9 i=13 i=21 i=100

Jumlah anggota cluster

Cluster 1 28 34 38 35 29

Cluster 2 36 45 43 44 47

Cluster 3 63 58 56 58 61


i=5 i=9 i=13 i=21 i=100


Cluster 1 27 38 28 34 28

Cluster 2 37 43 50 45 49

Cluster 3 73 56 59 58 50


i=5 i=9 i=13 i=21 i=100


Cluster 1 46 35 33 28 31

Cluster 2 43 44 45 36 45

Cluster 3 48 58 59 63 61


i=5 i=9 i=13 i=21 i=100


87


Cluster 1 48 30 27 32 31

Cluster 2 45 46 51 45 46

Cluster 3 44 61 59 60 60


i=5 i=9 i=13 i=21 i=100


Cluster 1 5 32 31 29 29

Cluster 2 57 45 46 47 47

Cluster 3 75 60 60 61 61

Dari hasil sebagian uji diatas, dapat disimpulkan dalam 5 kali percobaan

dengn galat (e )= 0,1 dan maksimal iterasi ()= 100 menghasilkan konsisten yang

rendah terhadap jumlah anggota perclusternya. Dengan kata lain jumlah anggota

perclusternya mengalami perubahan dari setiap kali uji.

Lalu merubah Galat (e) = 0,00001


i=5 i=9 i=13 i=21 i=100


Cluster 1 45 27 29 29 29

Cluster 2 45 52 48 46 47

Cluster 3 47 58 60 62 61


i=5 i=9 i=13 i=21 i=100



88

Cluster 1 47 43 29 29 29

Cluster 2 42 44 47 47 47

Cluster 3 48 50 61 61 61


i=5 i=9 i=13 i=21 i=100


Cluster 1 44 34 29 29 29

Cluster 2 46 44 47 46 47

Cluster 3 47 59 59 62 61


i=5 i=9 i=13 i=21 i=100


Cluster 1 35 27 30 29 29

Cluster 2 49 34 46 46 47

Cluster 3 53 76 61 62 61


i=5 i=9 i=13 i=21 i=100


Cluster 1 29 35 29 29 29

Cluster 2 43 44 47 46 47

Cluster 3 65 58 61 62 61


89

Dari hasil sebagian uji diatas, dapat disimpulkan dalam 5 kali percobaan

dengan galat (e)= 0,00001 dan maksimal iterasi ()= 100 menghasilkan konsisten

yang tinggi terhadap jumlah anggota perclusternya. Dengan kata lain jumlah

danggota perclusternya tidak mengalami perbedaan dari setiap kali uji.

Sehingga akan lebih baik jika menggunakan nilai Galat (e) yang kecil dan

maksimal iterasi (i) yang besar dalam melakukan proses clustering karena

menghasilkan konsistensi data anggota percluster yang tinggi dan hasilnya akan

semakin serupa dengan yang dihasilkan uji matlab.


90

Lampiran Data Uji Matlab

Data uji yang digunakan untuk matlab dan sistem yakni dengan banyak data

sejumlah 12 atribut dan 134 record,berikut cuplikan data yang ada pada file Data

IPA 2011.


91

LAMPIRAN GAMBAR SCREENSHOT UJI MATLAB

a. Screenshot Hasil Data uji Nilai Ujian Nasional dan Sekolah IPA tahun 2011

1. Hasil iteration count

2. Hasil pusat cluster iterasi


92

3. Hasil obj_fcn

4. Hasil Matriks U Baru iterasi terakhir

Keterangan Gambar Matriks U Baru iterasi terakhir yaitu

Data ke-1,2 ,3,.. masuk ke cluster 1, karena nilai matriks keanggotaannya

lebih besar di cluster 1 dari pada cluster 2 dan cluster 3

Data ke-…,128,129 ,130,dan 134 masuk ke cluster 3, karena nilai matriks

keanggotaannya lebih besar di cluster 3 dari pada cluster 1 dan cluster 2

Data ke-…,132,dan 133 masuk ke cluster 2, karena nilai matriks

keanggotaannya lebih besar di cluster 3 dari pada cluster 1 dan cluster 3


93

b. Screenshot Hasil Data uji Nilai Ujian Nasional IPA tahun 2011


2. Hasil pusat cluster


94

3. Hasil obj_fcn



95

c. Screenshot Hasil Data uji Nilai Sekolah IPA tahun 2011


2. Hasil pusat cluster


96

3. Hasil obj_fcn



97

LAMPIRAN GAMBAR SCREENSHOT HASIL UJI SISTEM

a. Dengan data Nilai Ujian Nasional dan Sekolah IPA tahun 2011

,cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir .

…..

…..

….


98

…

b. Dengan data Nilai Ujian Nasional IPA tahun 2011

,cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir

.

…


99

…

…

…


100

c. Dengan data Nilai Sekolah IPA tahun 2011

, cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir

…

…

…


101

…


102

Detail gambar screenshot perbandingan hasil percobaan table 4.8 member per

cluster hasil uji matlab dengan sistem

…


103


104

LAMPIRAN PERBANDINGAN DETAIL TABEL 4.14

Perbandingan hasil dari tabel 4.9, 4.11 dan 4.13

Kode

Sekolah

Data sekolah Hasil

NS

Hasil

UN

Hasil

UN

US

01-001

01-002

01-003

01-004

01-005

01-006

01-007

01-008

01-009

01-010

01-011

01-012

01-015

01-017

01-018

01-019

01-020

01-021

01-022

01-025

01-026

01-029

01-030

01-032

01-033

01-039

01-042

01-043

01-044

01-045

01-046

01-047

01-050

01-051

01-053






SMA STELLA DUCE 1 YOGYAKARTA

SMA BOPKRI 1 YOGYAKARTA

SMA BOPKRI 2 YOGYAKARTA

SMA BUDYA WACANA YOGYAKARTA

SMA BHINNEKA TUNGGAL IKA YOGYAKARTA

SMA TAMAN MADYA JETIS YOGYAKARTA

SMA MUHAMMADIYAH 1 YOGYAKARTA




SMA BUDI LUHUR YOGYAKARTA

SMA SULTAN AGUNG YOGYAKARTA






SMA GAJAH MADA YOGYAKARTA

SMA PIRI 2 YOGYAKARTA

SMA PANGUDI LUHUR YOGYAKARTA





SMA 'INSTITUT INDONESIA' 1 YOGYAKARTA


SMA K SANG TIMUR YOGYAKARTA

SMA MARSUDI LUHUR YOGYAKARTA

SMA PIRI 1 YOGYAKARTA

SMA TAMAN MADYA IBU PAWIYATAN YOGYAKARTA

3

1

2

1

1

3

2

2

2

1

2

2

2

3

2

2

1

2

2

1

1

1

1

2

1

3

2

1

2

2

1

2

3

2

2

2

2

2

2

2

2

1

2

1

3

1

1

2

2

2

1

1

2

1

3

1

1

2

3

1

2

2

1

1

1

3

1

3

1

1

1

1

1

1

1

1

3

1

3

2

3

3

1

1

1

3

2

1

3

2

3

3

1

2

3

1

1

3

3

3

2

3

2

3

3


105

01-054

01-055

01-056

01-058

02-001

02-002

02-003

02-004

02-005

02-006

02-008

02-009

02-012

02-014

02-016

02-020

02-021

02-023

02-025

02-026

02-027

02-029

02-030

02-031

02-034

02-035

02-038

02-044

02-045

02-046

02-047

02-049

02-050

03-001

03-002

03-003

03-004

03-005

03-006

03-009

03-012

03-013

03-014

03-015

SMA BERBUDI YOGYAKARTA

SMA STELLA DUCE 2 YOGYAKARTA

SMA SANTA MARIA YOGYAKARTA

SMA ISLAM TERPADU ABU BAKAR

SMA NEGERI 2 BANTUL

SMA NEGERI 1 BANTUL

SMA NEGERI 1 KASIHAN

SMA NEGERI 3 BANTUL

SMA NEGERI 1 SEDAYU

SMA NEGERI 1 SANDEN

SMA MUHAMMADIYAH BANTUL

SMA NEGERI 1 PAJANGAN

SMA MUHAMMADIYAH KASIHAN

SMA NEGERI 1 SRANDAKAN

SMA STELLA DUCE BANTUL

SMA PANGUDI LUHUR SEDAYU

SMA NEGERI 1 BAMBANGLIPURO

SMA NEGERI 1 SEWON

SMA NEGERI 1 IMOGIRI

SMA NEGERI 1 JETIS

SMA NEGERI 1 PLERET

SMA NEGERI 1 BANGUNTAPAN


SMA MUHAMMADIYAH IMOGIRI

SMA MUHAMMADIYAH PIYUNGAN

SMA BOPKRI BANGUNTAPAN

SMA NEGERI 1 PIYUNGAN

SMA PATRIA BANTUL

SMA NEGERI 1 PUNDONG

SMA UII BANGUNTAPAN

SMA NEGERI 2 BANGUNTAPAN

SMA NEGERI 1 DLINGO

SMA NEGERI 1 KRETEK

SMA NEGERI 1 WATES

SMA NEGERI 2 WATES

SMA NEGERI 1 TEMON

SMA NEGERI 1 PENGASIH

SMA NEGERI 1 KOKAP


SMA MA'ARIF WATES

SMA NEGERI 1 SENTOLO

SMA NEGERI 1 LENDAH

SMA NEGERI 1 SAMIGALUH

SMA NEGERI 1 KALIBAWANG

1

3

3

2

1

2

3

1

1

1

1

2

1

1

2

2

1

2

1

1

2

2

1

1

1

2

1

1

1

1

2

2

1

3

3

2

3

3

1

1

3

2

2

2

3

1

1

1

2

2

2

2

1

2

2

2

3

2

2

1

2

2

1

2

2

2

3

3

1

1

1

3

2

2

2

1

1

2

2

2

2

2

3

3

2

1

3

2

2

3

3

3

1

1

1

1

3

1

1

1

2

1

1

3

1

1

3

1

1

1

2

2

2

3

3

2

1

1

1

3

3

1

1

1

1

1

2

2

1

3

2

1


106

03-016

03-017

03-024

04-001

04-002

04-003

04-004

04-005

04-008

04-009

04-010

04-011

04-013

04-014

04-016

04-017

04-023

04-024

04-025

04-026

04-028

04-037

04-038

04-039

04-040

04-044

04-046

04-048

04-053

04-054

04-055

04-057

04-060

04-067

04-068

04-069

04-071

04-076

04-077

05-001

05-002

05-003

05-004

05-005

SMA NEGERI 1 GIRIMULYO

SMA MUHAMMADIYAH GALUR

SMA NEGERI 1 GALUR

SMA NEGERI 1 PRAMBANAN

SMA NEGERI 1 DEPOK

SMA NEGERI 1 KALASAN

SMA KOLESE DE BRITTO

SMA ANGKASA

SMA MANDALA BHAKTI

SMA GAMA YOGYAKARTA

SMA KOLOMBO SLEMAN

SMA IMANUEL KALASAN

SMA INSTITUT INDONESIA SLEMAN

SMA MUHAMMADIYAH 1 PRAMBANAN

SMA ISLAM 1 PRAMBANAN

SMA MUHAMMADIYAH KALASAN

SMA NEGERI 1 GODEAN

SMA NEGERI 1SEYEGAN

SMA NEGERI 1 GAMPING

SMA NEGERI 1 MINGGIR

SMA ISLAM 1 GAMPING

SMA NEGERI 1 SLEMAN

SMA NEGERI 2 SLEMAN

SMA NEGERI 1 TURI

SMA NEGERI 1 MLATI

SMA MUHAMMADIYAH MLATI

SMA SANTO MIKAEL SLEMAN

SMA MUHAMMADIYAH 1 SLEMAN

SMA NEGERI 1 PAKEM

SMA NEGERI 1 NGAGLIK

SMA NEGERI 2 NGAGLIK

SMA MUHAMMADIYAH PAKEM

SMA ISLAM 3 SLEMAN

SMA NEGERI 1 TEMPEL

SMA NEGERI 1 NGEMPLAK

SMA NEGERI 1 CANGKRINGAN

SMA PROKLAMASI '45

SMA IT BINA UMAT

SMA BUDI MULIA DUA

SMA 2 WONOSARI

SMA 1 WONOSARI

SMA 2 PLAYEN

SMA 1 PLAYEN

SMA 1 PATUK

2

3

1

2

3

3

3

1

2

2

1

1

1

1

2

1

3

1

3

2

1

3

2

3

3

3

1

2

3

2

1

2

1

2

2

3

1

2

3

2

3

2

2

2

2

3

2

2

2

2

2

3

3

1

1

3

3

3

3

3

2

1

2

2

1

2

1

1

2

1

1

3

2

1

2

3

3

1

1

1

1

1

1

2

2

2

3

1

1

2

1

1

1

1

1

2

2

3

3

2

2

2

2

2

1

3

1

1

3

1

3

3

1

3

3

2

1

3

1

2

2

3

3

3

3

3

3

1

1

1

2

3


107

05-006

05-007

05-009

05-012

05-020

05-021

05-022

05-024

05-025

05-027

05-034

SMA 1 PANGGANG

SMA 1 TANJUNGSARI

SMA MUHAMMADIYAH WONOSARI

SMA DOMINIKUS WONOSARI

SMA 1 KARANGMOJO

SMA 1 SEMIN

SMA 1 RONGKOP



SMA IKIP VETERAN III TAMBAKROMO

SMA 1 SEMANU

2

2

2

2

2

1

2

2

2

1

2

1

3

3

1

1

1

1

3

3

3

1

3

2

2

3

3

3

3

2

2

2

3


108

LAMPIRAN UJI MANUAL

1. Permasalahan

Data

Variabel

ING MAT BIO

x1 8.73 8.40 8.20 SMA NEGERI 3 YOGYAKARTA

x2 8.14 8.32 8.31 SMA NEGERI 1 BANTUL

x3 4.00 2.63 4.53 SMA PATRIA BANTUL

x4 5.80 3.75 4.38 SMA SANTO THOMAS YOGYAKARTA

x5 8.29 7.85 7.81 SMA NEGERI 1 SLEMAN

x6 8.47 8.14 7.95 SMA NEGERI 1 YOGYAKARTA

x7 5.58 3.52 4.52 SMA MUHAMMADIYAH SEWON

x8 4.55 2.96 4.66 SMA PEMBANGUNAN 2 KARANGMOJO

x9 3.93 2.97 4.69 SMA MUHAMMADIYAH WATES

x10 5.19 3.52 5.05 SMA PEMBANGUNAN 3 PONJONG


109

2. Menentukan besarnya kluster (k >= 2), pemangkat/pembobot (w>1), maks iterasi (max = 5),

galat (e= 0.01)

k = 2

fungsi objektif(P0) = 0, dan iterasi awal = 1

w = 2

max = 50

e = 0.001

P0 = 0

iter = 1

Iterasi 1

Langkah 3. Bentuk matriks partisi awal keanggotaan (Uik) yg nilai awalnya acak, i= banyak data, k = banyak kluster(antara0

-1)

Uik i k1 k2

1 0.21 0.36

2 0.66 0.18

3 0.01 0.22

4 0.38 0.76

5 0.16 0.81

6 0.12 0.94

7 0.09 0.62

8 0.46 0.51

9 0.11 0.8

10 0.81 0.13


110

Langkah 4. Hitung pusat kluster

i Uik Xij

1 2 1 2 3 Ui1^w Ui2^w

(Ui1^w) *

(Xi1)

(Ui1^w)

* (Xi2)

(Ui1^w)

* (Xi3)

(Ui2^w) *

(Xi1)

(Ui2^w)

* (Xi2)

(Ui2^w)

* (Xi3)

1 0.21 0.36 8.73 8.40 8.20 0.0441 0.1296 0.38 0.37 0.36 1.13 1.09 1.06

2 0.66 0.18 8.14 8.32 8.31 0.4356 0.0324 3.55 3.62 3.62 0.26 0.27 0.27

3 0.01 0.22 4.00 2.63 4.53 0.0001 0.0484 0.00 0.00 0.00 0.19 0.13 0.22

4 0.38 0.76 5.80 3.75 4.38 0.1444 0.5776 0.84 0.54 0.63 3.35 2.17 2.53

5 0.16 0.81 8.29 7.85 7.81 0.0256 0.6561 0.21 0.20 0.20 5.44 5.15 5.12

6 0.12 0.94 8.47 8.14 7.95 0.0144 0.8836 0.12 0.12 0.11 7.48 7.19 7.02

7 0.09 0.62 5.58 3.52 4.52 0.0081 0.3844 0.05 0.03 0.04 2.14 1.35 1.74

8 0.46 0.51 4.55 2.96 4.66 0.2116 0.2601 0.96 0.63 0.99 1.18 0.77 1.21

9 0.11 0.8 3.93 2.97 4.69 0.0121 0.64 0.05 0.04 0.06 2.52 1.90 3.00

10 0.81 0.13 5.19 3.52 5.05 0.6561 0.0169 3.41 2.31 3.31 0.09 0.06 0.09

1.5521 3.6291 9.563579 7.854828 9.321519 23.793303 20.077661 22.266364

Pusat Kluster

Vkj 1 2 3

1 6.162 5.061 6.006 2 6.556 5.532 6.136


111

Langkah 5. Hitung fungsi objektif baru (Pt)

i kluster 1 kluster 2 kluster 1 kluster 2

P1

(Xi1-

V11)^2

(Xi2-

V12)^2

(Xi3-

V13)^2 Total 1

(Xi1-

V21)^2

(Xi2-

V22)^2

(Xi3-

V23)^2

Total

2 Ui1^w P Ui2^w P

1 6.596 11.150 4.815 22.561 4.73 8.22 4.26 17.21 0.0441 0.995 0.1296 2.230 3.23

2 3.914 10.623 5.310 19.846 2.51 7.77 4.73 15.01 0.4356 8.645 0.0324 0.486 9.13

3 4.673 5.909 2.178 12.759 6.53 8.42 2.58 17.54 0.0001 0.001 0.0484 0.849 0.85

4 0.131 1.718 2.643 4.492 0.57 3.18 3.08 6.83 0.1444 0.649 0.5776 3.945 4.59

5 4.530 7.780 3.255 15.565 3.01 5.37 2.80 11.18 0.0256 0.398 0.6561 7.336 7.73

6 5.328 9.482 3.780 18.590 3.66 6.80 3.29 13.75 0.0144 0.268 0.8836 12.153 12.42

7 0.338 2.374 2.207 4.920 0.95 4.05 2.61 7.61 0.0081 0.040 0.3844 2.926 2.97

8 2.598 4.413 1.811 8.822 4.03 6.62 2.18 12.82 0.2116 1.867 0.2601 3.334 5.20

9 4.980 4.371 1.731 11.083 6.90 6.57 2.09 15.55 0.0121 0.134 0.64 9.954 10.09

10 0.944 2.374 0.913 4.232 1.87 4.05 1.18 7.09 0.6561 2.776 0.0169 0.120 2.90

59.11

Langkah 6. Perbaharui nilai U


112

(Xi1-

Vk1)^2

(Xi2-

Vk2)^2

(Xi3-

Vk3)^2

Total

1^-1

(Xi1-

Vk1)^2

(Xi2-

Vk2)^2

(Xi3-

Vk3)^2

Total

2 Total

Ui1 =

Tot1/Tot

Ui2 =

Tot2/Tot

1 6.60 11.15 4.81 0.04 4.73 8.22 4.26 0.06 0.10 0.433 0.567

2 3.91 10.62 5.31 0.05 2.51 7.77 4.73 0.07 0.12 0.431 0.569

3 4.67 5.91 2.18 0.08 6.53 8.42 2.58 0.06 0.14 0.579 0.421

4 0.13 1.72 2.64 0.22 0.57 3.18 3.08 0.15 0.37 0.603 0.397

5 4.53 7.78 3.26 0.06 3.01 5.37 2.80 0.09 0.15 0.418 0.582

6 5.33 9.48 3.78 0.05 3.66 6.80 3.29 0.07 0.13 0.425 0.575

7 0.34 2.37 2.21 0.20 0.95 4.05 2.61 0.13 0.33 0.607 0.393

8 2.60 4.41 1.81 0.11 4.03 6.62 2.18 0.08 0.19 0.592 0.408

9 4.98 4.37 1.73 0.09 6.90 6.57 2.09 0.06 0.15 0.584 0.416

10 0.94 2.37 0.91 0.24 1.87 4.05 1.18 0.14 0.38 0.626 0.374

Langkah 7. Cek Kondisi berhenti

Apakah iter >= max ? 1 >= 100 salah

Apakah | P1-P0| < galat ? 59.11 > 0.01 salah

Maka, Ulangi langkah ke 4

Iterasi 2

Langkah 4 Hitung pusat kluster

.

.

.

Ulangi hingga ,

Iterasi 6


113

Langkah 4 Hitung pusat kluster

i Uik Xij

1 2 1 2 3 Ui1^w Ui2^w

(Ui1^w) *

(Xi1)

(Ui1^w)

* (Xi2)

(Ui1^w)

* (Xi3) (Ui2^w)

* (Xi1)

(Ui2^w)

* (Xi2)

(Ui2^w)

* (Xi3)

1 0.003 0.997 8.73 8.40 8.20 0.000 0.994 0.00 0.00 0.00 8.67 8.35 8.15

2 0.003 0.997 8.14 8.32 8.31 0.000 0.994 0.00 0.00 0.00 8.09 8.27 8.26

3 0.983 0.017 4.00 2.63 4.53 0.967 0.000 3.87 2.54 4.38 0.00 0.00 0.00

4 0.969 0.031 5.80 3.75 4.38 0.939 0.001 5.45 3.52 4.11 0.01 0.00 0.00

5 0.004 0.996 8.29 7.85 7.81 0.000 0.992 0.00 0.00 0.00 8.22 7.78 7.74

6 0.000 1.000 8.47 8.14 7.95 0.000 0.999 0.00 0.00 0.00 8.46 8.13 7.94

7 0.985 0.015 5.58 3.52 4.52 0.970 0.000 5.41 3.41 4.38 0.00 0.00 0.00

8 0.997 0.003 4.55 2.96 4.66 0.994 0.000 4.52 2.94 4.63 0.00 0.00 0.00

9 0.985 0.015 3.93 2.97 4.69 0.970 0.000 3.81 2.88 4.55 0.00 0.00 0.00

10 0.991 0.009 5.19 3.52 5.05 0.982 0.000 5.10 3.46 4.96 0.00 0.00 0.00

5.822 3.980 28.16 18.76 27.02 33.46 32.54 32.10

Pusat Kluster

Vkj 1 2 3

1 4.836 3.222 4.641

2 8.406 8.176 8.066

Langkah 5. Hitung fungsi objektif baru (Pt)

i kluster 1 kluster 2 kluster 1 kluster 2 P3


114

(Xi1-

Vk1)^2

(Xi2-

Vk2)^2

(Xi3-

Vk3)^2 Total 1

(Xi1-

Vk1)^2

(Xi2-

Vk2)^2

(Xi3-

Vk3)^2

Total

2 Uik^w P Uik^w P

1 15.159 26.811 12.669 54.639 0.10 0.05 0.02 0.17 0.000 0.001 0.994 0.172 0.17

2 10.913 25.989 13.464 50.366 0.07 0.02 0.06 0.15 0.000 0.000 0.994 0.150 0.15

3 0.700 0.351 0.012 1.062 19.41 30.75 12.50 62.67 0.967 1.027 0.000 0.017 1.04

4 0.928 0.279 0.068 1.275 6.79 19.59 13.59 39.96 0.939 1.198 0.001 0.038 1.24

5 11.927 21.418 10.044 43.389 0.01 0.11 0.07 0.18 0.000 0.001 0.992 0.183 0.18

6 13.202 24.186 10.951 48.340 0.00 0.00 0.01 0.02 0.000 0.000 0.999 0.019 0.02

7 0.553 0.089 0.015 0.656 7.99 21.67 12.57 42.23 0.970 0.636 0.000 0.010 0.65

8 0.082 0.069 0.000 0.151 14.87 27.20 11.60 53.67 0.994 0.150 0.000 0.000 0.15

9 0.822 0.064 0.002 0.888 20.04 27.10 11.40 58.53 0.970 0.861 0.000 0.013 0.87

10 0.125 0.089 0.168 0.381 10.34 21.67 9.10 41.11 0.982 0.374 0.000 0.003 0.38

4.86

Langkah 6. Perbaharui nilai U

(Xi1-

Vk1)^2

(Xi2-

Vk2)^2

(Xi3-

Vk3)^2 Total 1

(Xi1-

Vk1)^2

(Xi2-

Vk2)^2

(Xi3-

Vk3)^2 Total 2 Total

Ui1 =

Tot1/Tot

Ui2 =

Tot2/Tot


115

1 15.16 26.81 12.67 0.02 0.10 0.05 0.02 5.77 5.79 0.003 0.997

2 10.91 25.99 13.46 0.02 0.07 0.02 0.06 6.61 6.63 0.003 0.997

3 0.70 0.35 0.01 0.94 19.41 30.75 12.50 0.02 0.96 0.983 0.017

4 0.93 0.28 0.07 0.78 6.79 19.59 13.59 0.03 0.81 0.969 0.031

5 11.93 21.42 10.04 0.02 0.01 0.11 0.07 5.41 5.43 0.004 0.996

6 13.20 24.19 10.95 0.02 0.00 0.00 0.01 53.29 53.32 0.000 1.000

7 0.55 0.09 0.01 1.52 7.99 21.67 12.57 0.02 1.55 0.985 0.015

8 0.08 0.07 0.00 6.62 14.87 27.20 11.60 0.02 6.64 0.997 0.003

9 0.82 0.06 0.00 1.13 20.04 27.10 11.40 0.02 1.14 0.985 0.015

10 0.12 0.09 0.17 2.62 10.34 21.67 9.10 0.02 2.65 0.991 0.009

Langkah 7. Cek Kondisi berhenti

Apakah iter >= max ? 6 >= 100 salah

Apakah | P6-P5| < galat ? 0.00 < 0.001 benar

Karena sudah memenuhi salah satu syarat yakni | P6-P5| < galat ,maka yang digunakan pusat kluster iterasi ke-6

Pusat Kluster

Vkj 1 2 3

1 4.8365 3.2220 4.6407

2 8.4062 8.1755 8.0659


116

Matriks U

U1 U2

0.003 0.997

0.003 0.997

0.983 0.017

0.969 0.031

0.004 0.996

0.000 1.000

0.985 0.015

0.997 0.003

0.985 0.015

0.991 0.009

Pengelompokan data setelah iterasi ke-5

Data Klaster

1 2

1


2

SMA NEGERI 1 BANTUL

3 SMA PATRIA BANTUL

4 SMA SANTO THOMAS YOGYAKARTA

5

SMA NEGERI 1 SLEMAN

6


7 SMA MUHAMMADIYAH SEWON

8 SMA PEMBANGUNAN 2 KARANGMOJO


117

9 SMA MUHAMMADIYAH WATES

10 SMA PEMBANGUNAN 3 PONJONG

Jadi member pada klaster 1 adalah

1. SMA PATRIA BANTUL,

2. SMA SANTO THOMAS YOGYAKARTA

3. SMA MUHAMMADIYAH SEWON

4. SMA PEMBANGUNAN 2 KARANGMOJO

5. SMA MUHAMMADIYAH WATES

6. SMA PEMBANGUNAN 3 PONJONG

Dan member pada klaster 2 adalah

1. SMA NEGERI 3 YOGYAKARTA

2. SMA NEGERI 1 BANTUL

3. SMA NEGERI 1 SLEMAN

4. SMA NEGERI 1 YOGYAKARTA


118

Lampiran Uji Pembahasan

Data yang digunakan dalam penelitian ini adalah data nilai Ujian Nasional dan Nilai Sekolah jurusan IPA tahun 2014. Data

berupa Nilal Ujian Nasional meliputi nilai Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi, serta Nilai Sekolah

meliputi nilai Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi. Kemudian dilakukan proses clustering dan

diperoleh hasil yaitu nilai fungsi obyektif selama iterasi, pusat cluster atau center serta derajat keanggotaan lulusan untuk setiap

cluster pada iterasi terakhir. Dalam penelitian ini, proses iterasinya berhenti pada iterasi ke-16 karena nilai |Pt - Pt-1|< ξ. Nilai fungsi

obyektif pada iterasi terakhir yang diperoleh adalah 229.56468745177847. Hasil dari clustering yang dilakukan dapat dilihat di

bawah ini

1. Nilai fungsi obyektif selama 16 iterasi dapat dilihat pada Tabel 1 di bawah ini:

Tabel 1. Nilai Fungsi Obyektif Selama 16

Iterasi Iterasi ke- Fungsi Obyektif

1 1155.5736314030255

2 415.13592847351043

3 396.01448828816535

4 335.9950949051618

5 278.9339644577249

6 254.11151626828388

7 239.70029181677043

8 233.37497040864258

9 231.13342998610136


119

10 230.25302077227119

.. …

16 229.56468745177847

2. Nilai pusat cluster atau center

Pada iterasi terakhir (iterasi ke-16), pusat cluster Vkj yang dihasilkan dengan k=1,2,3 dan j=1,2 adalah:

3. Derajat keanggotaan lulusan untuk sertiap cluster pada iterasi terakhir (iterasi ke-16)

Tabel 2. Derajat keanggota Pada Ketiga Cluster

Data

ke-

Derajat Keanggotaan (μ) SMA Setiap

Cluster Pada Iterasi Terakhir

μi1

μi2

μi3

1 0.05 0.108 0.842

2 0.024 0.068 0.909

3 0.012 0.031 0.957

4 0.027 0.066 0.906

7.152 4.619 3.673 3.623 3.698 4.717 8.811 8.757 8.74 8.751 8.722 8.741

7.831 5.651 4.94 4.732 4.907 5.951 8.397 8.359 8.331 8.308 8.318 8.339

8.313 7.05 6.986 6.62 6.436 7.433 8.376 8.39 8.297 8.318 8.339 8.344


120

5 0.045 0.191 0.763

6 0.022 0.06 0.918

7 0.069 0.316 0.614

8 0.277 0.675 0.048 . . .

.

.

.

.

.

.

.

.

.

141 0.428 0.514 0.059

Dari derajat keanggotaan lulusan pada iterasi terakhir dapat diperoleh informasi mengenai kecenderungan lulusan untuk masuk ke cluster mana.

Derajat keanggotaan terbesar menunjukkan bahwa kecenderungan tertinggi lulusan untuk masuk menjadi anggota cluster tersebut. Misalnya

untuk lulusan ke-1, dapat menjadi:

a. Anggota cluster pertama dengan derajat keanggotaan 0.05

b. Anggota cluster kedua dengan derajat keanggotaan 0.108

c. Anggota cluster ketiga dengan derajat keanggotaan 0.842

Derajat keanggotaan terbesarnya terletak di cluster ketiga, maka data ke -1 akan dimasukkan kedalam cluster ketiga. Hasil selengkapnya

pengelompokkan ke-141 SMA kedalam 3 cluster dapat dilihat pada di bawah ini:


121

Tabel 3. Anggota Pada Ketiga Cluster

Cluster Beranggotakan SMA dengan data ke-

1 10, 11, 16, 17, 19, 20, 21, 22, 23, 28, 30, 31, 33, 34, 35, 36, 47, 49, 50, 51,

52, 62, 63, 64, 66, 67, 69, 72, 78, 79, 80, 86, 92, 93, 94, 95, 97, 98, 99,

100, 105, 110, 111, 112, 114, 117, 130, 131, 133, 137, 138, 139, 140

2 8, 9, 12, 25, 29, 32, 38, 40, 45, 46, 48, 53, 54, 55, 58, 60, 61, 65, 68, 70,

71, 76, 81, 82, 83, 84,8 5, 87, 88, 96, 102, 103, 104, 107,108,115,116,

118, 119, 120, 121, 122, 123, 126, 127, 128, 129, 132, 134, 135, 136, 141

3 1, 2, 3, 4, 5, 6, 7, 13, 14, 15, 18, 24, 26, 27, 37, 39, 41, 42, 43, 44, 56, 57,

59, 73, 74, 75, 77, 89, 90, 91, 101, 106, 109, 113, 124, 125


122

Cluster Jumlah Anggota

Bahasa indoUN Bahasa InggrisUN MatematikaUN FisikaUN KimiaUN BiologiUN

RATA-

RATA

MAX MIN

RATA-

RATA

MAX MIN

RATA-

RATA

MAX

MIN RATA-

RATA

MAX MIN RATA-

RATA

MAX MIN RATA-

RATA

MAX MIN

1 53 7.152

8.50 5.30

4.619

5.93 3.57

3.673

4.75

2.89 3.623

5.00 2.65 3.698

4.78 2.39 4.717

6.25 3.21

2 25 7.831

8.25 6.84

5.651

7.76 4.38

4.94 6.31

4.17 4.732

6.99 3.66 4.907

6.03 4.08 5.951

6.83 5.10

3 36 8.313

9.40 5.51

7.05 8.20 5.85

6.986

8.35

5.50 6.62 7.83 5.00 6.436

7.25 5.59 7.433

9.00 6.40

Bahasa indoUS Bahasa InggrisUS MatematikaUS FisikaUS KimiaUS BiologiUS

RATA-

RATA

MAX MIN

RATA-

RATA

MAX MIN

RATA-

RATA

MAX

MIN RATA-

RATA

MAX MIN RATA-

RATA

MAX MIN RATA-

RATA

MAX MIN

8.811

9.71 8.02

8.757

9.74 7.80

8.74 9.72

7.96 8.751

9.72 7.97 8.722

9.69 8.00 8.741

9.71 7.73

8.397

9.28 7.96

8.359

9.03 7.75

8.331

8.91

7.87 8.308

8.96 7.82 8.318

8.96 7.81 8.339

8.93 7.91

8.376

9.32 7.80

8.39 9.45 7.80

8.297

9.34

7.67 8.318

9.34 7.77 8.339

9.31 7.81 8.344

9.29 7.77


123

Dari hasil di atas dapat diperoleh:

a. Berdasarkan uji coba clustering yang dilakukan, pada data SMA di DIY pada tahun 2011 jurusan IPA diset dalam 3 cluster.

b. Dari hasil uji coba, ketiga cluster tersebut diketahui bahwa pada cluster 1 memiliki jumlah yang paling banyak dengan 53 sekolah

sedangkan cluster 2 dengan 52 sekolah dan cluster 3 dengan 36 sekolah.

c. Untuk cluster 1 memiliki criteria nilai yang rendah dibanding kedua cluster yang lain di bagian nilai UN dan memiliki nilai tinggi dibagian

nilai US, sedangkan cluster 2 memiliki criteria nilai yang sedang dibanding kedua cluster yang lain di bagian nilai UN dan memiliki nilai

rendah dibagian nilai US, dan cluster 3 memiliki criteria nilai yang tinggi dibanding kedua cluster yang lain di bagian nilai UN dan memiliki

nilai sedang dibagian nilai US.


PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · banyak kekurangan. Untuk itu, penulis...

Documents

Transcript of PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · banyak kekurangan. Untuk itu, penulis...