PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

44
PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Oleh: Anggi Wijaya Sari Raja Gukguk 150210214 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK DAN KOMPUTER UNIVERSITAS PUTERA BATAM TAHUN 2021

Transcript of PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

Page 1: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

PENERAPAN DATA MINING DALAM PEMILIHAN

LAPTOP MENGGUNAKAN ALGORITMA C4.5

SKRIPSI

Oleh:

Anggi Wijaya Sari Raja Gukguk

150210214

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN KOMPUTER

UNIVERSITAS PUTERA BATAM

TAHUN 2021

Page 2: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

PENERAPAN DATA MINING DALAM PEMILIHAN

LAPTOP MENGGUNAKAN ALGORITMA C4.5

SKRIPSI Untuk memenuhi salah satu syarat

memperoleh gelar Sarjana

Oleh :

Anggi Wijaya Sari Raja Gukguk

150210214

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN KOMPUTER

UNIVERSITAS PUTERA BATAM

TAHUN 2021

ii

Page 3: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

SURAT PERNYATAAN ORISINALITAS

Yang bertanda tangan dibawah ini saya:

Nama : Anggi Wijaya Sari Raja Gukguk

Npm 150210214

Fakultas : Teknik dan Komputer

Program Studi : Teknik Informatika

Menyatakan bahwa ” Skripsi” yang saya buat dengan judul:

PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP

MENGGUNAKAN ALGORITMA C4.5 Adalah hasil karya sendiri dan bukan

“duplikasi” dari karya orang lain. Sepengetahuan saya, di dalam naskah skripsi ini

tidak terdapat karya ilmiah atau pendapat yang pernah ditulis atau diterbitkan oleh

orang lain, kecuali yang secara tertulis dikutip didalam naskah ini dan disebutkan

dalam sumber kutipan dan daftar pustaka. Apabila ternyata didalam naskah skripsi

ini dapat dibuktikan terdapat unsur-unsur PLAGIASI,saya bersedia naskah skripsi

ini digugurkan dan gelar Akademik yang saya peroleh dibatalkan,serta diproses

sesuai dengan peraturan perundang-undangan yang berlaku.

Demikian pernyataan ini saya buat dengan tanpa ada paksaan dari siapapun.

Batam, 30 Juli 2021

Yang membuat pernyataan,

Anggi Wijaya Sari Raja Gukguk 150210214

iii

Page 4: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

PENERAPAN DATA MINING DALAM PEMILIHAN

LAPTOP MENGGUNAKAN ALGORITMA C4.5

SKRIPSI Untuk memenuhi salah satu syarat

memperoleh gelar Sarjana

Oleh

Anggi Wijaya Sari Raja Gukguk

150210214

Telah disetujui oleh Pembimbing pada tanggal

seperti tertera dibawah ini

Batam, 30 Juli 2021

Sunarsan Sitohang, S.Kom., M.TI.

Pembimbing

iv

Page 5: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

ABSTRAK

Perkembangan globalisasi saat ini sangat mempengaruhi berbagai bidang, salah

satunya bidang teknologi. Laptop atau komputer tenteng adalah sebuah komputer

yang dapat dibawa kemana saja karena memiliki ukuran yang kecil dan ringan

tergantung pada ukuran,bahan dan spesifikasi laptop tersebut. Kegunaan laptop

yang sama dengan komputer yaitu dapat memudahkan mengerjakan tugas dan

pekerjaan dengan cepat dan baik. Bagi kalangan anak muda adakalanya laptop

untuk hiburan dengan banyak nya game yang ditawarkan. Toko Good Cell Batam

merupakan salah satu toko yang menyediakan berbagai macam tipe laptop.

Karena banyak nya tipe laptop membuat konsumen sulit dalam memilih laptop

yang tepat sehingga pihak toko mengalami kesulitan saat memberikan informasi

yang jelas kepada konsumen. Maka diperlukan suatu teknik data mining serta

metode algoritma C4.5 dalam melakukan klasifikasi pemilihan laptop yang tepat

berdasarkan variabel harga, kapasitas RAM, prosessor, ukuran dan daya tahan

batrai. Aplikasi WEKA digunakan untuk meguji keakuratan dari data yang diolah

menggunakan algoritma C4.5 . Hasil ini diperoleh dengan mencari nilai entropy

dan gain dari semua variabel sehingga menghasilkan pohon keputusan dimana

terdapat tiga variabel yang sangat mempengaruhi pemilihan laptop yaitu harga,

prosessor dan daya tahan batrai dari 80 data secara keseluruhan dimana terdapat

53 pemilihan laptop yang tepat dan 27 pemilihan laptop yang tidak tepat.

Kata kunci: Algoritma C45, Data Mining, Klasifikasi, WEKA.

v

Page 6: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

ABSTRACT

The current development of globalization greatly affects various fields, one of

which is technology. Laptop or handheld computer is a computer that can be

taken anywhere because it has a small size and light weight depending on the size,

material and specifications of the laptop. The use of a laptop is the same as a

computer, which can make it easier to do tasks and work quickly and well. For

young people, laptops are sometimes used for entertainment with lots of games on

offer. Good Cell Batam store is one of the stores that provide various types of

laptops. Because of the many types of laptops, it is difficult for consumers to

choose the right laptop so that the store has difficulty providing clear information

to consumers. Then we need a data mining technique and the C4.5 algorithm

method in classifying the right laptop selection based on price variables, RAM

capacity, processor, size and battery life. The WEKA application is used to test

the accuracy of the data processed using the C4.5 algorithm. These results are

obtained by looking for the entropy and gain values of all variables so as to

produce a decision tree where there are three variables that greatly affect the

selection of laptops, namely price, processor and battery life from 80 data in total

where there are 53 selection of the right laptop and 27 selection of the right

laptop. not exactly.

Keywords: C45 Algorithm, Data Mining, Classification, WEKA.

vi

Page 7: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

KATA PENGANTAR

Puji dan syukur kepada Tuhan yang maha Esa yang telah melimpahkan

segala rahmat dan karuniaNya, sehingga penulis dapat menyelesaikan laporan

tugas akhir yang merupakan salah satu persyaratan untuk menyelesaikan program

studi strata satu (S1) pada Program Studi Teknik Informatika Universitas Putera

Batam.

Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Karena itu,

kritik dan saran akan senantiasa penulis terima dengan senang hati. Dengan segala

keterbatasan, penulis menyadari pula bahwa skripsi ini takkan terwujud tanpa

bantuan, bimbingan dan dorongan dari berbagai pihak. Untuk itu, dengan segala

kerendahan hati, penulis menyampaikan ucapan terima kasih kepada:

1. Rektor Universitas Putera Batam.

2. Dekan Fakultas Teknik dan Komputer bapak Ganda Sirait, S.SI.,M.SI

3. Ketua Program Studi bapak Andi Maslan, S.T., M.SI.

4. Bapak Sunarsan Sitohang, S.Kom., M.TI. selaku pembimbing Skripsi

pada Program Studi Teknik Informatika Universitas Putera Batam.

5. Dosen dan Staf Universitas Putera Batam.

6. Kedua Orang tua penulis yang selalu mendoakan dan memberi

semangat.

7. Teman-teman seangkatan yang berjuang bersama dan saling memberi

semangat dan motivasi.

Serta berbagai pihak yang telah membantu dalam menyelesaikan skripsi ini secara

langsung maupun tidak langsung.

Batam, 30 Juli 2021

Anggi Wijaya Sari Raja gukguk

vii

Page 8: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

DAFTAR ISI

Halaman

HALAMAN SAMPUL ....................................................................................... ii

HALAMAN JUDUL .......................................................................................... ii

SURAT PERNYATAAN .................................................................................. iii

HALAMAN PENGESAHAN ........................................................................... iv

ABSTRAK .......................................................................................................... v

ABSTRACT........................................................................................................ vi

KATA PENGANTAR ...................................................................................... vii

DAFTAR ISI ................................................................................................... viii

DAFTAR GAMBAR ......................................................................................... x

DAFTAR TABEL ............................................................................................. xi DAFTAR RUMUS ........................................................................................... xii

BAB I PENDAHULUAN

1.1 Latar Belakang ............................................................................................. 1

1.2 Identifikasi Masalah .................................................................................... 4

1.3 Batasan Masalah ......................................................................................... 4

1.4 Rumusan Masalah ....................................................................................... 5

1.5 Tujuan Penelitian ........................................................................................ 5

1.6 Manfaat Penelitian ...................................................................................... 6

1.6.1 Manfaat Teoritis .......................................................................................... 6

1.6.2 Manfaat Praktis ........................................................................................... 7

BAB II KAJIAN PUSTAKA

2.1 Knowledge Discovery In Database (KDD) .................................................. 8 2.2 Data Mining .............................................................................................. 10

2.2.1 Manfaat Data Mining ................................................................................ 11

2.2.2 Fungsi Data Mining ................................................................................... 11

2.2.3 Penerapan Data Mining ............................................................................. 12

2.2.4 Teknik Pembelajaran Data Mining ............................................................ 13

2.2.5 Kategori Data Mining ............................................................................... 14

2.3 Metode Data Mining.................................................................................. 14

2.3.1 Classification (Klasifikasi) ........................................................................ 15 2.3.2 Pohon Keputusan ...................................................................................... 16

2.3.3 Algoritma C4.5.......................................................................................... 18

2.4 Software Pendukung ................................................................................. 19

2.4.1 Waikato Environment for Knowledge Analysis (WEKA) ........................... 19

2.5 Penelitian Terdahulu ................................................................................. 20

2.6 Kerangka Pemikiran .................................................................................. 24

BAB III METODE PENELITIAN

3.1 Desain Penelitian......................................................................................... 26

3.2 Teknik Pengumpulan Data .......................................................................... 28

3.3 Operasional Variabel .................................................................................. 29 3.4 Metode Perancangan Sistem ....................................................................... 30

viii

Page 9: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

3.5 Lokasi dan Jadwal Penelitian ..................................................................... 31

3.5.1 Lokasi Penelitian ....................................................................................... 31

3.5.2 Jadwal Penelitian ....................................................................................... 32

BAB IV HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian ............................................................................................ 33 4.2 Pembahasan ................................................................................................. 34

4.3 Analisa Data ................................................................................................ 34

4.3.1 Pembersihan data ...................................................................................... 35

4.3.2 Seleksi data ............................................................................................... 35

4.3.3 Transformasi data ...................................................................................... 38

4.3.4 Pohon keputusan ....................................................................................... 42

4.3.5 Pengujian menggunakan Aplikasi WEKA ................................................. 56

BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan .................................................................................................. 61

5.2 Saran ............................................................................................................ 62

DAFTAR PUSTAKA

LAMPIRAN

1. Pendukung Penelitian

2. Daftar Riwayat Hidup 3. Surat Keterangan Penelitian

ix

Page 10: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

DAFTAR GAMBAR

Halaman

Gambar 4. 1 Pohon Keputusan Node 1.............................................................. 49

Gambar 4. 2 Pohon Keputusan Node 2.............................................................. 52

Gambar 4. 3 Pohon Keputusan Node 3.............................................................. 55

Gambar 4. 4 Format Data Microsoft Excel ....................................................... 56

Gambar 4. 5 Halaman Awal aplikasi WEKA .................................................... 57

Gambar 4. 6 Membuka Data Pada Aplikasi WEKA .......................................... 57

Gambar 4. 7 Pemilihan Variabel Pada Aplikasi WEKA .................................... 58

Gambar 4. 8 Pemilihan Model Classify ............................................................. 58

Gambar 4. 9 Classify Output pada WEKA ........................................................ 59

Gambar 4. 10 Visualize Tree Pada WEKA ........................................................ 59 Gambar 4. 11 Hasil Visualize Tree WEKA ....................................................... 60

x

Page 11: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

DAFTAR TABEL

Halaman

Tabel 3. 1 Jadwal Penelitian .............................................................................. 32

Tabel 4. 1Format Data Penjualan ....................................................................... 36

Tabel 4. 2 Klasifikasi Atribut Harga .................................................................. 38

Tabel 4. 3 Klasifikasi Atribut Kapasitas RAM .................................................. 39

Tabel 4. 4 Klasifikasi Atribut Prosessor ............................................................. 39

Tabel 4. 5 Klasifikasi Atribut Ukuran ............................................................... 39

Tabel 4. 6 Klasifikasi Daya Tahan Batrai ......................................................... 40

Tabel 4. 7 Format Data Pra-Proses Penjualan .................................................... 40

Tabel 4. 8 Hasil Perhitungan Node 1.................................................................. 48

Tabel 4. 9 Hasil Perhitungan Node 2................................................................. 52

Tabel 4. 10 Hasil Perhitungan Node 3 ................................................................ 54

xi

Page 12: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

DAFTAR RUMUS

Halaman

Rumus 2. 1 Perhitungan Gain........................................................................... 18

Rumus 2. 2 Perhitungan Entrophy ..................................................................... 19

xii

Page 13: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

BAB I

PENDAHULUAN

1.1 Latar Belakang

Perkembangan globalisasi saat ini sangat mempengaruhi berbagai bidang,

salah satunya yaitu bidang teknologi. Perkembangan teknologi yang semakin

pesat dan memamasuki fase society 5.0. Dari sisi kehidupan, teknologi juga

sangat dibutuhkan untuk dapat membantu dan mempermudah pekerjaan. Barang-

barang elektronik pun tidak lagi menjadi barang mewah saat ini. Dampak positif

perkembangan teknologi di fase society 5.0 yakni menjadikan manusia semakin

cerdas, individual, serta memiliki harapan yang tinggi karena dengan mudah

terhubung langsung ke dunia global yang menyajikan data–data terbaru. Harapan

tersebut akan terlihat ketika manusia dilihat dari sisi konsumtifnya. Mereka akan

mencari barang yang paling cocok dengan kriteria mereka, untuk memenuhi

kebutuhan seiring perkembangan zaman. Barang – barang elektronik juga telah

mengalami perkembangan seperti televisi, telepon, komputer dan laptop.

Laptop atau komputer tenteng merupakaan sebuag komputer yang dapat

dibawah kemana saja serta memiliki ukuran kecil dan ringan, tergantung pada

ukuran, bahan, dan spesifikasi laptop tersebut. Laptop juga sering disebut dengan

komputer notebook atau notebook saja. Laptop mempunyai kegunaaan mirip

dengan komputer desktop (Desktop Computers) seperti umumnya yaitu dapat

1

Page 14: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

2

memudahkan mengerjakan tugas dan pekerjaan dengan kilat dan baik. (Ginting,

2015). Disamping itu juga dengan adanya laptop dapat digunakan untuk

menambah penghasilan dengan banyaknya penjualan secara online. Bagi kalangan

anak muda, ada kalanya untuk hiburan dengan banyaknya game yang ditawarkan.

Oleh sebab itu, Laptop bukan lagi menjadi barang mewah. Laptop juga sudah

menjadi aspek penting dari kebutuhan berbagai kalangan seperti karyawan,

pembisnis, dan siswa maupun mahasiswa untuk menunjang pekerjaan maupun

studinya.

Toko Good Cell Batam yang beralamat di Lantai Dasar Blok K1 No. A2A-

Mitra Mall, Batu Aji Kota Batam ini adalah salah satu toko yang menyediakan

berbagai merk laptop. Toko Good Cell Batam termasuk toko yang paling ramai

dikunjungi oleh banyak orang yang akan membeli maupun sekedar tanya-tanya

laptop. Sehingga toko Good Cell Batam sering kali mengalami kesulitan dalam

membantu konsumen menentukan jenis dan tipe laptop yang akan dibeli. Hal ini

terjadi karena banyaknya jenis dan harga bersaing yang ditawarkan oleh pihak

produsen laptop. Untuk memilih laptop yang tepat sesuai dengan kebutuhan dan

dana yang disiapkan oleh konsumen, maka memerlukan suatu analisa yang akurat

yang dapat dijadikan bahan pertimbangan dari banyaknya kriteria dan faktor.

Kriteria - kriteria yang dapat dijadikan acuan dalam memilih suatu laptop antara

lain yaitu harga, kapasitas RAM, prosesor, ukuran dan daya tahan batrai dari

laptop tersebut. Untuk mengolah semua kriteria tersebut maka diperlukan suatu

sistem yang dapat menentukan dan mengelompokkan kriteria- kriteria yang dipilih

Page 15: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

3

oleh konsumen, sehingga dapat membantu konsumen dalam memilih laptop yang

tepat.

Data mining merupakan suatu proses pengolahan data dengan teknik

statistik, matematika, kecerdasan buatan, dan machine learning untuk

mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan

yang terkait dari berbagai database besar. Data mining juga diartikan sebagai

proses untuk membangun hubungan, struktur dan model baru yang dapat

digunakan dalam penyeleksian data yang sangat besar. Salah satu teknik dari data

mining adalah klasifikasi. (Seng Hansun, 2014)

Algoritma C45 merupakan algoritma yang banyak dimanfaatkan dalam

proses pengklasifikasian pohon keputusan sebab mempunyai kelebihan utama

dibandingkan algortitma lainnya. Kelebihan algoritma C45 dapat menghasilkan

pohon keputusan yang mudah diinterprestasikan, mempunyai angka kebenaran

yang bisa diterima, efisien dalam menangani atribut bertipe diskret dan dapat

menangani atribut bertipe diskret dan numerik. (Seng Hansun, 2014)

Pengolahan data mining menggunakan metode algoritma C45 yang

bertujuan untuk memperoleh informasi berupa pemilihan laptop. Maka penulis

tertarik untuk melakukan penelitian dengan judul “Penerapan Data Mining

Dalam Pemilihan Laptop Menggunakan Algoritma C4.5” berdasarkan latar

belakang yang telah dijelaskan sebelumnya.

Page 16: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

4

1.2 Identifikasi Masalah

Berdasarkan latar belakang yang sudah dipaparkan diatas, maka terdapat

beberapa identifikasi masalah dalam penelitian ini yaitu sebagai berikut:

1. Jenis laptop yang banyak mengakibatkan sulit dalam memilih laptop yang

tepat.

2. Tidak ada acuan dalam menentukan pilihan laptop yang tepat

berdasarkan kebutuhan konsumen.

3. Tidak ada pemanfaatan dari data arsip toko yang lama sebagai tolak ukur

dalam pemilihan laptop yang tepat bagi konsumen.

1.3 Batasan Masalah

Demi menjauhi adanya kekeliruan dari tema serta maksud semestinya,

sehingga perlu ditetapkan batasan terhadap masalah yang akan dibahas, antara

lain sebagai berikut:

1. Penelitian ini dilakukan di toko Good Cell Batam.

2. Pengujian pada penelitian ini menggunakan aplikasi WEKA.

3. Data yang digunakan dalam penelitian ini yaitu data penjualan toko Good

Cell selama 3 tahun dari tahun 2018 hingga 2020.

Page 17: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

5

1.4 Rumusan Masalah

Beralaskan paparan dari latar belakang diatas, maka dapat disimpukan suatu

masalah dalam penelitian ini yang akan diteliti yaitu sebagai berikut:

1. Bagaimana teknik data mining mengetahui jenis laptop yang tepat untuk

konsumen?

2. Bagaimana penerapan data mining khususnya teknik klasifikasi

menggunakan metode algoritma c45 dalam menentukan pilihan laptop pada

toko Good Cell Batam?

3. Bagaimana teknik klasifikasi menggunakan algoritma c45 dalam

menentukan pola pemilihan laptop terhadap konsumen yaitu berupa pohon

keputusan yang terbentuk dari perhitungan entropy dan gain?

1.5 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah diuraikan diatas, maka tujuan

yang akan dicapai oleh penelitian ini yaitu sebagai berikut:

1. Untuk mengetahui penerapan data mining yang digunakan dalam

menentukan pilihan laptop yang tepat bagi konsumen toko Good Cell.

2. Untuk mengurangi resiko kesalahan pilih laptop pada toko Good Cell.

Page 18: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

6

3. Untuk memperoleh keputusan tentang acuan dan standar dalam pemilihan

laptop yang sesuai dengan keinginan maupun kemampuan konsumen

dengan menggunakan metode dalam data mining yaitu algoritma c45.

1.6 Manfaat Penelitian

Penelitan ini diharapkan berguna bagi pembaca. Manfaat dari penelitian

yang dilakukan ini dibagi menjadi dua bagian yaitu sebagai berikut:

1.6.1 Manfaat Teoritis

Manfaat teoritis yang diharapkan dapat diperoleh dari penelitian ini adalah

sebagai berikut:

1. Menetapkan konsep berkenaan algoritma c4.5 dalam mnunjukkan

pemilihan laptop pada toko Good Cell Batam.

2. Sebagai tambahan sumber pada penelitian-penelitian dimasa akan datang

yang memiliki kaitan erat dengan teknik data mining dengan metode

algoritma c45.

3. Dapat memperluas ilmu tentang data mining khususnya algoritma c45

dalam hal data-data yang selama ini dianggap tidak berguna atau dibuang

oleh pihak pemilik data tersebut.

Page 19: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

7

1.6.2 Manfaat Praktis

Selain manfaat teoritis, maka ada juga manfaat praktis yang diharapkan

dapat diperoleh dari penelitian ini adalah sebagai berikut:

1. Dapat difungsikan sebagai tolak ukur untuk menentukan pemilihan laptop

yang tepat di toko Good Cell Batam sehingga dapat memberikan kepuasan

bagi konsumen saat membeli.

2. Memberikan saran kepada toko Good Cell Batam dalam menentukan

pemilihan laptop perlu adanya kriteria-kriteria standar yang diterapkan.

3. Memperoleh ilmu baru tentang teknik data mining khususnya metode

algoritma c45 dalam menentukan pemilihan laptop yang tepat supaya pihak

toko Good Cell Batam dapat meningkatkan kualitas pelayanan terhadap

konsumen.

Page 20: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

BAB II

KAJIAN PUSTAKA

2.1 Knowledge Discovery In Database (KDD)

Knowledge Discovery in Database (KDD) adalah merupakan metode dalam

mendapatkan keahlian basis data yang ada. Dalam database diperoleh grafik-

grafik yang saling terhubung satu sama lainnya. Pengambilan keputusan dari hasil

keahlian yang didapatkan melalui tahapan yang berguna sebagai basis

pengetahuan (knowledge base). Istilah Knowledge Discovery in Database (KDD)

dan data mining biasanya dimanfaatkan secara bergantian dalam memperjelas

tahapan penggalian informasi tertanam pada database besar. Dari kedua

perumpamaan tersebut mempunyai ide tidak serupa namun memiliki keterikatan

diantaranya, dan satu diantaranya yaitu bagian dari keseluruhan prosedur

Knowledge Discovery in Database (KDD) adalah data mining. (Mardi, 2018)

Tahapan Knowledge Discovery in Database (KDD) secara ilustrasi bisa

dijalaskan sebagai berikut:

1. Data Selection

Sebelum proses penggalian informasi Knowledge Discovery in Database

(KDD) dimulai, maka diperlukan proses penyeleksian data dari sekelompok data

operasional. Hasil dari penyeleksian data tersebut disimpan kedalam berkas

terpisah dari database operasional untuk proses data mining.

8

Page 21: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

9

2. Pre-processing / Cleaning

Tahapan pembersihan data pada saat fokus Knowledge Discovery in

Database (KDD) dilaksanakan sebelum proses data mining dimulai. tahapan

penyortiran data meliputi yaitu penyortiran data ganda, mendalami inkosisten

data, dan mengubah data yang salah cetak. Selain itu juga ada proses enrichment,

adalah data atau informasi luar yang dibutuhkan oleh Knowledge Discovery in

Database (KDD) yang valid melalui tahapan memperbanyak data yang telah

diketahui sebelumnya.

3. Transformation Coding

Tahapan coding dalam Knowledge Discovery in Database (KDD) ialah

prosedur yang bergantung pada macam atau bentuk dari informasi yang akan

dicari pada database serta prosedur transmutasi atas berita yang sudah diambil

berdasarkan kemauan pada data mining.

4. Data Mining

Data mining merupakan suatu cara dalam mencari sketsa serta berita

menarik dalam yang telah terpilih oleh teknik dan metode tertentu. Data mining

memiliki banyak teknik dan metode atau algoritma yang beranekragam sehingga

pemilihan metode dan algoritma yang tepat sangat bergantung pada hasil dan

tahapan dari Knowledge Discovery in Database (KDD) secara keseluruhan.

5. Interpretation / Evaluation

Bentuk informasi dari proses data mining yang telah diperoleh yaitu harus

memiliki bentuk yang sederhana yang gampang dipahami oleh pihak yang

bersangkutan. Proses ini adalah bagian dari Knowledge Diccovery in Database

Page 22: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

10

(KDD) yang diartikan sebagai interpretation. proses ini mencakup pemeriksaan

apakah sketsa atau berita yang didapatkan bertolak belakang dengan fakta atau

hipotesis sebelumnya tang sudah ada. (Mardi, 2018)

2.2 Data Mining

Data mining memanfaatkan prosedur khusu untuk memperoleh skema

maupun berita merampas atas sebuah berita. Tahapan dari Data mining yang

digunakan dalam mengekstrak serta mengidentifikasi suatu informasi yang

dibutuhkan oleh database besar dengan cara teknik statistik, matematika,

kecerdeasan buatan, dan machine. (Mardi, 2018)

Tahapan induk dari kumpulan informasi yang dimana didalam nya terlibat

beberapa bidang yaitu bidang bidang ilmu statistik, mesin pembelajaran, dan

sistem managemen database dalam pemanfaatan algoritma serta dipergunakan

untuk menghasilkan data tersembuyi dalam suatu database yang besar merupan

pengertian dari data mining. (Yanto & Khoiriah, 2015)

Data mining merupakan sebuah cara yang dibantu oleh metode statistik

matematika, kecerdasan buatan, dan machine learning untuk menghasilkan dan

membuktikan berita yang bermanfaat serta ilmu yang berhubungan dengan

database besar. Data mining juga dapat diartikan sebagai rangkaian cara pada

proses penggalian data yang besar serta nilai tambah suatu kelompok data yang

merupakan ilmu yang tidak diketahui secara manual selama ini. (Faisal, 2019)

Page 23: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

11

2.2.1 Manfaat Data Mining

Dalam data mining terdapat 2 dimensi, yaitu dimensi komersial dan dimensi

keilmuan. (Vulandari, 2017) yaitu sebagai berikut:

1. Dari dimensi komersial, penggunaan data mining dapat peruntukkan

menanggapi meluapnya isi data, dengan cara memanfaatkan metode

komputasi sehingga dapat memperoleh berita-berita yang diperlukan aset

supaya dapat menaikkan daya saing suatu kelompok.

2. Dari dimensi keilmuan, data mining dimanfaatkan dalam menggambar,

mengaanalisis serta mengamankan besar yang berkarakter realtime.

2.2.2 Fungsi Data Mining

Manfaat-manfaat yang sering dipergunakan pada data mining menurut

haskett 2000 (Vulandari, 2017), sebagai berikut:

1) Assosiation, merupakan tahapan yang digunakan dalam memperoleh

kebijakan asosiasi kombinasi barang pada suatu waktu.

2) Sequence, merupakan tahapan yang digunakan untuk menenukan kebijakan

asosiasi kombinasi barang dalam waktu banyak.

3) Clustering, merupakan tahapan dari kumpulan data serta memiliki

kumpulan database sama.

4) Classification, merupakan tahapan yang digunakan untuk membedakan

struktur maupun kelas data yang bertujuan supaya objek tersembunyi.

Page 24: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

12

5) Regression, merupakan tahapan pembagian berita marka perkiraan.

6) Forecasting, merupakan pembedaan nilai perkiraan dari sekelompok

bentuk.

7) Solution, merupakan penemuan biang masalah yang dihadapi untuk

pemugutan kesimpulan.

2.2.3 Penerapan Data Mining

Menurut (Vulandari, 2017), penerapan data mining terdiri dari 3 penerapan

yaitu sebagai berikut:

1. Analisa Pasar Dan Manajemen

Asal mula berita atas diaplikasikan seolah negosiasi nota utang, nota

kelompok group eksklusif, nota potongan, protes konsumen, ditingkatkan via

belajar mengenai konsep tumbuh masa. Macam-macam jalan keluar yang bisa

diatasi oleh data mining antara lain:

a) Menghabisi sasaran market

b) Melihat kodisi daya beli dimasa depan

c) Analisis lintas pasar

d) tentang costumer

e) Melihat keperluan costumer

f) Mengapresiasi kelayakan custumer

g) Berita pendapatan

2. Analisa Perusahan Dan Manajemen Resiko

Page 25: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

13

a) Perencanaan keuangan dan evaluasi aset

b) Perencanaan sumber daya

c) Persaingan

3. Telekomunikasi

Data mining digunakan untuk meningkatkan pelayanan langsung dengan

banyaknya penjualan yang diterima serta menyortir penjualan yang harus dilayai

secara manual.

2.2.4 Teknik Pembelajaran Data Mining

Terdapat tiga metode utama yang merupakan bagian dari metode data

mining yang sangat erat dengan penemuan (discovery) dan pembelajaran

(learning) yaitu :

1. Supervised Learning

Supervised learning adalah metode yang sering dipergunakan. Metode ini

juga disebut “Programming By Example”. Metode ini sangat bergantung tahapan

latihan pada data historis yang memiliki bagian-bagian pemetaan terdahap hasil

pengolahan algoritma data mining.

2. Unsupervised Learning

Metode ini kebalikan dari metode supervised learning. Metode ini sangat

bergantung kepada pemanfaatn algoritma yang mendeteksi semua bentuk, seperti

assosiation dan sequence, yang ada pada spesifik dalam data pemasukan.

3. Reinforcement Learning

Page 26: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

14

Metode ini memiliki control adaptif namun paling jarang digunakan.

2.2.5 Kategori Data Mining

(Vulandari, 2017) Data mining terdiri dari 2 kategori utama yaitu seperti

berikut:

1. Prediktif

Berfungsi dalam menentukan nilai atribut tertentu yang dilihat dari atribut-

atribut lainnya.

2. Deskriptif

Berfungsi dalam menentukan bentuk maupun struktur dalam merangkum

hubungan utama dalam data.

2.3 Metode Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang

dapat dilakukan (Mardi, 2018), yaitu:

1. Description (Deskripsi)

Deskripsi merupakan bentuk dari kecenderungan yang sering memberikan

kemungkinan penjelasan dari suatu pola.

2. Estimation (Estimasi)

Estimasi merupakan hasil dari variabel target berdasarkan hasil prediksi

yang hampir sama fungsi nya dengan klasifikasi.

3. Prediction (Prediksi)

Page 27: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

15

Prediksi ini sendiri memmiliki kemiripan dengan klasifikasi dan estimasi,

tetapi prediksi lebih mengarah ke hasil dimasa yang akan datang.

4. Classification (Klasifikasi)

Merupakan bagaian dari kategori yang dikelompokkan menjadi beberapa

bagian.

5. Clustering (Pengklusteran)

Merupakan kumpulan objek-objek yang hampir sama satu dengan yang

laiinnya serta memiliki ketidaksamaan dengan objek dri kelompok lainya

6. Association (Asosiasi)

Merukan bagian dari data mining yang dari menemukan item yang muncuk

dalam watu yang bersamaan.

Berdasarkan penjelasan dari beberapa kelompok yng telah dijelaskan diatas,

maka metode dari teknik data mining yang akan digunakan dalam penelitian ini

yaitu menggunakan teknik Classification (Klasifikasi).

2.3.1 Classification (Klasifikasi)

Proses pengklasifikasian merupakan salah satu pekerjaan dari data mining.

Kemunculan klasifikasi awalnya dilakukan pada bagian tanaman yang dilakukan

pada bentuk tertentu, seperti (Carolus Linnaeus) yang dilakukan oleh Carolus von

Linne yang mulanya tidak diketahui nama pada saat pengklasifikasian bentuk

berdasarkan karakter fisik. Selanjutnya dia dikenal sebagai bapak klasifikasi.

Beberapa metode klasifikasi umum digunakan dalam data mining adalah: Pohon

Page 28: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

16

keputusan, Pengklasifikasi bayes/naive bayes, Jaringan saraf tiruan, Analisis

statistik, Algoritma genetik, Rough sets, Pengklasifikasi k-nearest neighbour,

Metode berbasis aturan, Memory based reasoning, Support vector machine.

(Faisal, 2019)

Klasifikasi data merupakan proses pengklasifikasian dalam ruang yang

berbeda-beda yang ditetapkan sebagai model klasifikasi dari sebuah database

yang berupa pola-pola yang ditemukan oleh himpunan obyek. Klasifikasi itu

sendiri memiliki tujuan yaitu pola dari training set kedalam kelopok atau kelas

yang sesuai berdasarkan atribut yang berbeda-beda, pola tersebut selanjutnya

digunakana untuk pengklasifikasian atribut dengan kelas yang belum diketahui

sebelumnya. (Azwanti, 2018)

2.3.2 Pohon Keputusan

Pohon keputusan dikenal sebagai contoh bentuk pohon (tree) yang mana

setiap node mencontohkan atribut, cabangnya mencontohkan nilai dari atribut dan

daun mencontohkan kelas. Root merupakan pohon keputusan paling atas dari

sebuah node. Pohon keputusan memiliki keuntungan dalam mengekstrak dan

mencontohkan bentuk dalaam klasifikasi aturan if-then salah satunya adalah C4.5

(Azwanti, 2018)

Pohon keputusan atau decission tree adalah beberapa metode dari teknik

data maning yang dimanfaatkan sebagai pengklasifikasian. Pohon keputusan

adalah aturan yang sangat gampang dipelajari dengan bahasa sehari-hari serta

dapat merubah kebenaran yang besar menjadi sebuah merepresentasikan aturan.

Page 29: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

17

Sebuah pohon keputusan adalah sebuah konsep yang dapat dimanfaatkan dalam

proses pembagian elemen-elemen data besar menjadi sebuah tumpukan record

yang berukuran mini yang diterapkan sebagai serangkaian aturan keputusan.

Salah satu algortima yang dimanfaatkan untuk pembentukan pohon keputusan

yaitu algoritma C4.5. (Faisal, 2019)

Pola dari pohon kesimpulan sengaja disamakan dengan arsitektur yang ada

apa sebuah pohon dan penegsannya, ialah seperti berikut ini:

1. Simpul bagian akar

Merupakan bagian akar paling atas dari pola pada pohon keputusan.

2. Simpul internal

Merupakan bagian cabang lanjutan dari simpul akar. Simpul ini akan

mengeluarkan simup maksimal 2 dari 1 simpul yang dimasukkan.

3. Simpul daun

Merupakn bagian palingujung dari semua pohon yang tidan memiliki

turunan atau keluaran.

Struktur poko kesimpulan memiliki tiga macam node yaitu (Elisa &

Ervina, 2018) :

1. Rood Node yaitu node pertama adalah node yang mempunyai input namun

tidak mempunyai output tetapi banyak output juga.

2. Internal Node yaitu node pembagian adalah node dengan 1 input dan output

yang banyak.

3. Leaf Node yaitu node akhir adalah node dengan input saja.

Page 30: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

18

2.3.3 Algoritma C4.5

Salah satu algoritma dalam membentuk suatu pokok kesimpulan yang biasa

dipakai adalah algoritma C4.5. Algoritma C4.5 adalah pengembangan atas ID3,

pengembanganya untuk melumpuhkan nilai yang hilang, biasanya melumpuhkan

data selanjutnya serta harapan. Algoritma C4.5 merupakan metode untuk

menstruktur sebuah pohon keputusan berkenaan dengan berita yang didapatkan

terlebih dahulu. Gaya pertama yang melandasi algoritma ini adalah

pengstrukturan potoh kesimpulan berkenaan gaya cabang yang memiliki marka

gain tertinggi berkenaan dengan marka entropy cabang tersebut semisal under

step dari algoritma ini yaitu mempunyai nilai gain tertinggi berdasarkan nilai

entrophy bagian dari proses pengklasifikasian. Rumus gain tertinggi dapat dilihat

sebagai berikut ini (Elisa & Ervina, 2018) .

1) Perhitungan Gain Tertinggi

𝑛

𝐺𝑎𝑖𝑛 (𝑆, 𝐴 ) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ 𝑖=1

𝑆𝑖

𝑆

∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆𝑖)

Dimana:

S : Himpunan kasus

A : Atribut

N : Jumlah partisi atribut A

|Si| : Jumlah kasus pada partisi ke-i

|S| : Jumlah kasus dalam S

Rumus 2. 1 Perhitungan Gain

Page 31: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

19

Selanjutnya melakukan perhitungan nilai entrophy dapat disimak pada

persamaan berikut ini:

Dimana:

S : Himpunan kasus

A : Fitur

N : Jumlah partisi S

𝑛

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ 𝑖=1

− 𝑃𝑖 ∗ 𝑙𝑜𝑔2𝑃𝑖

Rumus 2. 2 Perhitungan Entrophy

Pi : Proporsi dari Si terhadap S

2.4 Software Pendukung

2.4.1 Waikato Environment for Knowledge Analysis (WEKA)

Waikato Environment for Knowledge Analysis adalah sebuah kelompok alat

pembelajaran mesin praktis yang disingkat WEKA. Aplikasi ini diciptakan di

Universitas Waikato, New Zealand bagi ulasan, keahlian dan macam-macam

aplikasi. Keuntungan menggunakan WEKA yaitu khususnya klasifikasi yang

dilandasi oleh pendekatan-pendekatan sangat mampu menyelesaikan masalah-

masalah data mining dalam dunia nyata. Selain itu WEKA juga sangat gampang

diterapkan dibeberapa tahapan berbeda dan WEKA menyediakan alat untuk pre-

processing data, klasifikasi, regresi, clustering, aturan asosiasi, dan visualisasi.

Ada beberapa metode dari data mining yang bisa dieksekusi menggunakan

Page 32: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

20

aplikasi WEKA yang sering digunnakan yaitu pohon keputusan (decision tree).

Kontruksi dai pohon keputusan yang melibatkan node keputusan yang akan

disambungkan ke setiap bagian-bagian mulai simpul akar sampai ke node daun

(akhir) merupakan bagian yang menarik dari metode klasifikasi. Pada node

kesimpulan indikasi bakal dites, lalu tiap-tiap reaksi atas memperoleh bagian.

Tiap-tiap bagian akan ditunjukkan ke node lain atau ke node akhir untuk

mendapatkan hasil yaitu berupa keputusan. (Pujiono, Amborowati, & Suyanto,

2013)

2.5 Penelitian Terdahulu

Penelitian terdahulu merupakan acuan dalam sebuah penelitian. Peneliti

juga menemukan beberapa hasil penelitian terdahulu yang berhungan dengan

algoritma C4.5 antara lain sebagai berikut:

1. (Mardi, 2018) dalam jurnal yang berjudul “Data Mining : Klasifikasi

Menggunakan Algoritma C4.5” menyatakan bahwa Knowledge Discovery

in Database (KDD) merupakan bagian teringgi dari data mining, dimana

data dengan jumlah yang sangat besar dapat diolah kedalam data mining

dengan melakukan berbagai metode untuk memperoleh sebuah berita seperti

pengklasifikasian maupun memprediksi. Pohon keputusan yang dihasilkan

melalui algoritma C4.5 agar gampang dimengerti adalah bagian dari

klasifikasi dalam data mining.

2. (Novianti & Bahri, Tedy Rismawan, 2016) dalam jurnal berjudul

“Implementasi Data Mining Dengan Algoritma C4.5 Untuk Penjurusan

Page 33: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

21

Siswa (Studi Kasus: Sma Negeri 1 Pontianak)” menyatakan bahwa

klasifikasi penjurusan siswa berdasarkan penggolongan siswa berdasarkan

kemamampuan (nilai), bakat serta minat yang hampir sama sehingga

pembelajaran yang akan diajarkan akan lebih fokus dan teratur. Salah satu

institusi pendidikan yang berada di kota Pontianak yaitu SMA Negeri 1

dimana sekolah tersebut memilik dua penjurusan yaitu IPA dan IPS.

Kurikulum 2013 saat ini yang mengatur proses penyeleksian berdasarkan

nilai rata-rata rapor SMP, nilai UAS SMP serta nilai tes MTK,IPA dan IPS.

Metode algoritma C4.5 dimanfaatkan sebagai proses dalam

pengklasifikasian data sehingga mampu menghasilkan pohon keputusan

berdasarkan proses penyeleksian data sebelumnya sehingga menghasilkan

tingkat akurasi sebesar 89.74%.

3. (Mirqotussa’adaha, Much Aziz Muslima & Budi Prasetiyoa, 2017) dalam

jurnal yang berjudul “Penerapan Dizcretization dan Teknik Bagging

Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada

Algoritma C4.5 dalam Mendiagnosa Diabetes” menyatakan bagi aspek

bakal kesehatan, data mining bakal difungsikan dalam memperkirakan

suatu penyakit dari data rekam medis pasien. Sehingga digunakan untuk

meningkatkan ketetapan algoritma pengkelompokkan dalam merancang

berbagai classifier dari data training dalam mematenkan discretization dan

teknik bagging untuk klasifikasi berbasis ensemble pada algoritma C4.5

dapat meningkatkan akurasi sebesar 6,26%. Hasil ketetapan dari 68,61%,

kemudian ditetapkan discretization dan metode bagging menjadi 74,87%.

Page 34: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

22

4. (Purwadi, 2018) dalam jurnal yang berjudul “Implementasi Data Mining

Untuk Memprediksi Pola Pembelian Sepeda Motor Pada Showroom Cv.

Viva Mas Motors Dengan Metode Algoritma C4.5” menyatakan bahwa

kecenderungan kelakuan konsumen dalam memilih sepeda motor menjadi

bagian yang perlu di prediksi dengan menganalisa produksi sepeda motor

yang semakin kompetitif. Fakta menyatakan bahwa permsalahan pola

pembelian terdahap sepeda motor merupakan bagian yang akan diolah.

metode Algoritma C4.5 bagian dari data mining ini digunakan untuk

memprediksi pola pembelian sepda motor. field merk, tahun, dan harga

merupakan variabek yang mempengaruhi pemilihan sepeda motor sehingga

variabel iniakan dihitung nilai entropy serta gain terbesar sehingga dapat

menghasilkan root dari tree.

5. (Nurul Aswanti, 2018) dalam jurnal yang berjudul “Penerapan Algoritma

C4.5 Untuk Memprediksi Besarnya Penggunaan Listrik Rumah

Tangga Di Kota Batam” menyatakan bahwa Listrik sudah menjadi

kebutuhan manusia dalam kegiatan sehari-hari. Penggunaan listrik mulai

dari peralatan rumah tangga seperti kulkas, kipas angin, mesin cuci hingga

alat komunikasi seperti handphone, laptop dan berbagai macam alat

elektronik lainnya yang sangat membutuhkan energi listrik. Batam

merupakan salah satu kota besar dan padat di Indonesia salah satunya

daerah Batam Center. Akibat kepadatan penduduk tersebut menyebabkan

kebutuhan energi listrik meningkat. PT PLN Batam (b’right) merupakan

perusahaan dikota batam yang menyediakan sumber energi listrik. Dalam

Page 35: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

23

kasus ini sangat diperlukan suatu teknik yang bisa digunakan untuk

memprediksi penggunaan listrik rumah tangga supaya program pemerintah

dalam upaya penghematan energi listrik dapat tercapai. Salah satu teknik

yang dapat digunakan dalam kasus ini yaitu teknik data mining dengan

melakukan klasifikasi menggunakan metode algoritma C45. Hasil yang

dicapai dari metode algoritma C45 berupa pohon keputusan dimana variabel

jumlah anggota keluarga, luas bangunan rumah dan lama waktu dirumah

menjadi variabel penting dari prediksi besarnya pemakaian listrik. Pengujian

dilakukan menggunakan Weka yang menghasilkan rule yang sama dengan

pohon keputusan yang terbentuk.

6. (Hilda Amalia, 2017) dalam jurnal yang berjudul “Penentuan Proses

Persalinan Ibu Melahirkan Menggunakan Algoritma C4.5” menyatakan

bahwa melahirkan merupakan sebuah karunia yang dirasakan oleh semua

ibu. Proses persalinan ada dua macam yaitu normal dan operasi keduanya

memiliki tujuan yang sama yaitu keselamatan ibu dan anak. Oleh sebab itu

diperlukan suatu teknik dari data mining, sehingga dapat menghasilkan

prediksi proses persalinan ibu melahirkan. Algoritma C4.5 merupakan salah

satu teknik data mining yang mampu menghasilkan pohon keputusan.

Dengan adanya prediksi proses persalinan ini dapat dipilih proses

melahirkan yang tepat sehingga dapat terhindar dari resiko persalinan.

Dalam penelitian ini akan dilakukan pengolahan data-data kesehatan ibu

melahirkan dengan algoritma c4.5 diperoleh hasil akurasi sebesar 90%.

Page 36: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

24

7. (Kurniawan, Wicaksono, & Astuti, 2016) dalam jurnal yang berjudul

“Pemanfaatan Educational Data Mining (Edm) Untuk Memprediksi

Masa Studi Mahasiswa Menggunakan Algoritma C4.5 (Studi Kasus: Ti-

S1 Udinus)” Menyatakan bahwa institusi pendidikan yang memiliki

ketersediaaan data yang banyak diharapkan dapat dimanfaatkan dengan

baik dan benar. Bentuk pembelajaran mahasiswa serta hubungan antar

atribut data pendidikan menjadi fokus dalam penelitian karena sangat

mempengaruhi data yang besar. Penerapan metode Algoritma C4.5 dari data

mining diharapkan dapat menemukan pola klasifikasi terhadap mahasiswa

dengan kelulusan tercepat dan kelulusan yang lambat serta perkiraan data yg

diuji. Sehingga Algoritma C4.5 mampu melakukan prediksi dengan

kebenaran yang baik (73,68%) terhadap masa studi mahasiswa dengan

kelulusan tepat waktu dan kelulusan lambat.

2.6 Kerangka Pemikiran

Struktur pemikiran merupakan suatu struktur yang menegaskan mengenai

jalan nalar yang nantinya akan dipergunakan dalam penelitian. Berikut ini adalah

gambaran dari struktur pemikiran dari penelitian ini:

Page 37: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

25

Sumber: Data Peneliti (2021)

Data penjualan yang berusul dari hasil data rekapan penjualan laptop selama

3 tahun pada Toko Good Cell Batam menjadi data input dalam proses penelitian,

kemudian diolah kedalam metode algoritma C4.5, selanjutnya data yang telah

diolah dengan metode Algoritma C4.5 diuji menggunakan aplikasi WEKA,

sehingga menghasilkan output berupa hasil pemilihan laptop yang tepat bagi

konsumen maupun calon konsumen dari Toko Good Cell Batam.

Pemilihan Laptop Yang

Tepat

Pengolahan Data

Menggunakan

Metode algoritma

C4.5

Data Penjualan

Toko Good Cell

Batam

Implementasi Menggunakan

Aplikasi WEKA

Page 38: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

BAB III

METODE PENELITIAN

3.1 Desain Penelitian

Sebelum masuk kebagian teknik penelitian, desain penelitian perlu

dirancang terlebih dahulu. Dengan tujuan untuk memudahkan penelitian ke

tahapan selanjutnya. Adapun Desaian penelitian dalam penelitian ini mulai dari

awal hingga akhir, yaitu dapat dilihat sebagai berikut:

Sumber: Data Penelitian (2021)

Berkenaan dengan desain penelitian diatas, penjelasannya dapat dilihat

sebagai berikut:

26

Pengolahan Data Menggunakan

Metode Algoritma C4.5

Penyeleksian Data Penjualan

Laptop Pada Toko Good Cell Batam

Pengumpulan Data Penjualan

Laptop Pada Toko Good Cell Batam

Hasil Penelitian pemilihan laptop

yang tepat Pada Toko Good Cell

Batam

Implementasi Dan Pengujian

Menggunakan Aplikasi WEKA

Page 39: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

27

1. Pengumpulan Data

Proses ini dilakukan guna mendapatkan berita yang dibutuhkan dalam

penelitian guna mencapai tujuan yang diinginkan oleh peneliti. Data yang

diperoleh yaitu berupa data penjualan laptop Toko Good Cell Batam,

melalui wawancara, observasi dan study pustaka mengenai data mining serta

metode Algoritma C4.5.

2. Penyeleksian Data

Proses ini dilakukan guna menghasilakan data yang benar-benar sesuai

dengan kebutuhan serta tujuan penelitian yang nantinya akan dijadikan

sampel. Data yang dipilih yaitu berupa data-data Penjualan Laptop Pada

Toko Good Cell Batam dari tahun 2018 hingga 2020.

3. Pengolahan Data

Data yang telah melakukan proses penyeleksian sebelumnya, kemudian

akan diproses dan diolah kedalam teknik data mining dengan menggunakan

metode algoritma C4.5.

4. Implementasi

Aplikasi WEKA akan digunakan sebagai aplikasi yang digunakan dalam

pengujian untuk pemilihan laptop pada Toko Good Cell Batam.

5. Hasil Penelitian

Hasil yang menjadi tujuan dari penelitian ini adalah untuk menentukan

pemilihan laptop pada Toko Good Cell Batam yang telah diolah dengan

teknik data mining menggunakan metode algoritma C4.5 dengan proses

pengujian menggunakan aplikasi WEKA.

Page 40: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

28

3.2 Teknik Pengumpulan Data

Teknik pengumpulan data dalam penelitian ini menggukan 3 teknik yaitu,

observasi, wawancara, dan studi pustaka. Penjelasan dari ketiga teknik

pengumpulan data yaitu sebagai berikut:

1. Observasi

Observasi merupakan serangkaian proses psikologis dan biologis yang

tersusun secara kompleks. Observasi dalam penelitian ini dilakukan secara

langsung pada Toko Good Cell Batam untuk melakukan pengamatan

terhadap data penjualan laptop serta mengetahui variabel-variabel yang

dibutuhkan dalam proses pengolahan data sebagai bahan dalam penelitian.

2. Wawancara

wawancara merupakan suatu proses untuk memperoleh informasi langsung

dari sumbernya. Dalam penelitian ini peneliti melakukan wawancara

langsung dengan karyawan Toko Good Cell Batam yang bertujuan untuk

memperoleh informasi tentang penjulan laptop serta kendala-kendala yang

sering mereka alami saat memberikan informasi yang tepat bagi konsumen

saat membeli laptop ditoko Toko Good Cell Batam.

3. Studi Pustaka

Pada penelitian ini, peneliti melakukan pengelompokkan beberapa sumber

sebagai partisan penelitian yang diperoleh dari buku-buku, jurnal dan dari

bermacam referensi yng memiliki keterikatan dengan obiek penelitian.

Page 41: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

29

3.3 Operasional Variabel

Proses pengolahan data dilakukan sesuai dengan data penjualan laptop pada

Toko Good Cell Batam. Variabel – variabel yang diperlukan dalam proses analisa

data yaitu berdasarkan:

1. Harga

Harga merupkan aspek utama dalam membeli laptop, karena harga bisa

mengukur seberapa bagus laptop yang akan dibeli.

2. Kapasitas RAM

Kapasitas RAM merupakan salah satu faktor yang mempengaruhi kinerja

laptop. Kapasitas setiap laptop tentu berbeda. Semakin besar RAM yang

dipasang maka semakin besar juga tempat penyimpanan data. Oleh kerena

itu kapasitas RAM perlu diperhatikan saat membeli laptop.

3. Prosesor

Bagian yang tidak kalah penting dalam pemilihan laptop ialah prosesor.

Prosesor merupakan bagian dari dapur pacu. Ada beragam jenis prosesor

yang dijual di pasaran baik tipe AMD maupun Intel.

4. Ukuran Laptop

Ukuran layar yang dipilih saat membeli laptop baru, tentunya akan

memengaruhi ukuran laptop.

5. Daya Tahan Batrai

Page 42: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

30

Rata-rata laptop yang dijual memiliki daya tahan baterai kisaran 6 - 8 jam.

Namun ketahanan baterai agak sulit diukur karena tergantung

pemakaian laptop.

Dari variabel-variabel yang telah disebutkan dan dijelaskan diatas, maka

keputusan yang akan dihasilkan yaitu Tepat dan Tidak Tepat.

3.4 Metode Perancangan Sistem

Bagian dari metode perancangan sistem pada penelitian ini dapat dilihat

sebagai berikut:

Sumber: Data Peneliti (2021)

Imlementasi Dan Pengujian Data

Menggunakan Aplikasi WEKA

Hasil Penelitian Pemilihan Laptop Yang

Tepat Pada Toko Good Cell Batam

Pengolahan Data Penjualan Toko Good

Cell Batam Menggunakan Metode

Algoritma C4.5

Hasil Seleksi Data Penjualan Toko Good

Cell Batam

Penyeleksian Data Penjualan Toko Good

Cell Batam

Data Penjualan Toko Good Cell Batam

Page 43: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

31

Berkenaan dengan struktur dari perancangan sistem diatas, terlihat bahwa

tahapan pertama yang dilakukan pada penelitian ini yaitu memperoleh data

penjualan laptop dengan kriteria seperti harga, kapasitas RAM, prosesor, ukuran

dan daya tahan batrai dari laptop pada Toko Good Cell Batam, kemudian

dilakukan proses penyeleksian data hingga memperoleh data yang layak yang

akan diproses ke tahapan selanjutnya. Setelah memperoleh hasil penyeleksian data

telah selesai, maka data penjualan tersebut selanjutnya diolah kedalam teknik data

mining menggunakan metode algoritma C4.5, selanjutnya diuji dengan

menggunakan aplikasi WEKA, untuk mengetahui keakuratan antara proses

perhitungan manual tersebut sesuai dengan hasil pengujian melalui aplikasi

WEKA dalam menentukan pilihan laptop yang tepat berdasarakan data yang

diolah.

3.5 Lokasi dan Jadwal Penelitian

Pada penelitian ini, menunjukkan lokasi dan jadwal yang dilangsungkan

yaitu sebagai berikut:

3.5.1 Lokasi Penelitian

Penelitian ini dilangsungkan pada Toko Good Cell Batam yang beralamat

Lt. dasar Blok K1 No.A2A Mitra Mall Kec. Batu Aji, Kota Batam.

Page 44: PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …

32

3.5.2 Jadwal Penelitian

Jadwal penelitian yang dilakukan pada penelitian ini yaitu selama enam

bulan dari bulan maret 2021 hingga agusus 2021, sesuai dengan jadwal yang

tercantum dikalender akademik Universitas Putera Batam, jadwal penelitian yang

dilakukan dapat dilihat pada tabel berikut:

Tabel 3. 1 Jadwal Penelitian

Kegiatan

Waktu Kegiatan

Maret 2021

April 2021

Mei 2021

Juni 2021

Juli 2021

Agustus 2021

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

Pengajuan Judul

Penyususnan BAB I

Penyususnan BAB II

Penyususnan BAB III

Penyususnan BAB IV

Penyususnan BAB V

Pengumpula n

Skripsi

Sumber: Data Peneliti (2021)