PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …
Transcript of PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP …
PENERAPAN DATA MINING DALAM PEMILIHAN
LAPTOP MENGGUNAKAN ALGORITMA C4.5
SKRIPSI
Oleh:
Anggi Wijaya Sari Raja Gukguk
150210214
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN KOMPUTER
UNIVERSITAS PUTERA BATAM
TAHUN 2021
PENERAPAN DATA MINING DALAM PEMILIHAN
LAPTOP MENGGUNAKAN ALGORITMA C4.5
SKRIPSI Untuk memenuhi salah satu syarat
memperoleh gelar Sarjana
Oleh :
Anggi Wijaya Sari Raja Gukguk
150210214
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN KOMPUTER
UNIVERSITAS PUTERA BATAM
TAHUN 2021
ii
SURAT PERNYATAAN ORISINALITAS
Yang bertanda tangan dibawah ini saya:
Nama : Anggi Wijaya Sari Raja Gukguk
Npm 150210214
Fakultas : Teknik dan Komputer
Program Studi : Teknik Informatika
Menyatakan bahwa ” Skripsi” yang saya buat dengan judul:
PENERAPAN DATA MINING DALAM PEMILIHAN LAPTOP
MENGGUNAKAN ALGORITMA C4.5 Adalah hasil karya sendiri dan bukan
“duplikasi” dari karya orang lain. Sepengetahuan saya, di dalam naskah skripsi ini
tidak terdapat karya ilmiah atau pendapat yang pernah ditulis atau diterbitkan oleh
orang lain, kecuali yang secara tertulis dikutip didalam naskah ini dan disebutkan
dalam sumber kutipan dan daftar pustaka. Apabila ternyata didalam naskah skripsi
ini dapat dibuktikan terdapat unsur-unsur PLAGIASI,saya bersedia naskah skripsi
ini digugurkan dan gelar Akademik yang saya peroleh dibatalkan,serta diproses
sesuai dengan peraturan perundang-undangan yang berlaku.
Demikian pernyataan ini saya buat dengan tanpa ada paksaan dari siapapun.
Batam, 30 Juli 2021
Yang membuat pernyataan,
Anggi Wijaya Sari Raja Gukguk 150210214
iii
PENERAPAN DATA MINING DALAM PEMILIHAN
LAPTOP MENGGUNAKAN ALGORITMA C4.5
SKRIPSI Untuk memenuhi salah satu syarat
memperoleh gelar Sarjana
Oleh
Anggi Wijaya Sari Raja Gukguk
150210214
Telah disetujui oleh Pembimbing pada tanggal
seperti tertera dibawah ini
Batam, 30 Juli 2021
Sunarsan Sitohang, S.Kom., M.TI.
Pembimbing
iv
ABSTRAK
Perkembangan globalisasi saat ini sangat mempengaruhi berbagai bidang, salah
satunya bidang teknologi. Laptop atau komputer tenteng adalah sebuah komputer
yang dapat dibawa kemana saja karena memiliki ukuran yang kecil dan ringan
tergantung pada ukuran,bahan dan spesifikasi laptop tersebut. Kegunaan laptop
yang sama dengan komputer yaitu dapat memudahkan mengerjakan tugas dan
pekerjaan dengan cepat dan baik. Bagi kalangan anak muda adakalanya laptop
untuk hiburan dengan banyak nya game yang ditawarkan. Toko Good Cell Batam
merupakan salah satu toko yang menyediakan berbagai macam tipe laptop.
Karena banyak nya tipe laptop membuat konsumen sulit dalam memilih laptop
yang tepat sehingga pihak toko mengalami kesulitan saat memberikan informasi
yang jelas kepada konsumen. Maka diperlukan suatu teknik data mining serta
metode algoritma C4.5 dalam melakukan klasifikasi pemilihan laptop yang tepat
berdasarkan variabel harga, kapasitas RAM, prosessor, ukuran dan daya tahan
batrai. Aplikasi WEKA digunakan untuk meguji keakuratan dari data yang diolah
menggunakan algoritma C4.5 . Hasil ini diperoleh dengan mencari nilai entropy
dan gain dari semua variabel sehingga menghasilkan pohon keputusan dimana
terdapat tiga variabel yang sangat mempengaruhi pemilihan laptop yaitu harga,
prosessor dan daya tahan batrai dari 80 data secara keseluruhan dimana terdapat
53 pemilihan laptop yang tepat dan 27 pemilihan laptop yang tidak tepat.
Kata kunci: Algoritma C45, Data Mining, Klasifikasi, WEKA.
v
ABSTRACT
The current development of globalization greatly affects various fields, one of
which is technology. Laptop or handheld computer is a computer that can be
taken anywhere because it has a small size and light weight depending on the size,
material and specifications of the laptop. The use of a laptop is the same as a
computer, which can make it easier to do tasks and work quickly and well. For
young people, laptops are sometimes used for entertainment with lots of games on
offer. Good Cell Batam store is one of the stores that provide various types of
laptops. Because of the many types of laptops, it is difficult for consumers to
choose the right laptop so that the store has difficulty providing clear information
to consumers. Then we need a data mining technique and the C4.5 algorithm
method in classifying the right laptop selection based on price variables, RAM
capacity, processor, size and battery life. The WEKA application is used to test
the accuracy of the data processed using the C4.5 algorithm. These results are
obtained by looking for the entropy and gain values of all variables so as to
produce a decision tree where there are three variables that greatly affect the
selection of laptops, namely price, processor and battery life from 80 data in total
where there are 53 selection of the right laptop and 27 selection of the right
laptop. not exactly.
Keywords: C45 Algorithm, Data Mining, Classification, WEKA.
vi
KATA PENGANTAR
Puji dan syukur kepada Tuhan yang maha Esa yang telah melimpahkan
segala rahmat dan karuniaNya, sehingga penulis dapat menyelesaikan laporan
tugas akhir yang merupakan salah satu persyaratan untuk menyelesaikan program
studi strata satu (S1) pada Program Studi Teknik Informatika Universitas Putera
Batam.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Karena itu,
kritik dan saran akan senantiasa penulis terima dengan senang hati. Dengan segala
keterbatasan, penulis menyadari pula bahwa skripsi ini takkan terwujud tanpa
bantuan, bimbingan dan dorongan dari berbagai pihak. Untuk itu, dengan segala
kerendahan hati, penulis menyampaikan ucapan terima kasih kepada:
1. Rektor Universitas Putera Batam.
2. Dekan Fakultas Teknik dan Komputer bapak Ganda Sirait, S.SI.,M.SI
3. Ketua Program Studi bapak Andi Maslan, S.T., M.SI.
4. Bapak Sunarsan Sitohang, S.Kom., M.TI. selaku pembimbing Skripsi
pada Program Studi Teknik Informatika Universitas Putera Batam.
5. Dosen dan Staf Universitas Putera Batam.
6. Kedua Orang tua penulis yang selalu mendoakan dan memberi
semangat.
7. Teman-teman seangkatan yang berjuang bersama dan saling memberi
semangat dan motivasi.
Serta berbagai pihak yang telah membantu dalam menyelesaikan skripsi ini secara
langsung maupun tidak langsung.
Batam, 30 Juli 2021
Anggi Wijaya Sari Raja gukguk
vii
DAFTAR ISI
Halaman
HALAMAN SAMPUL ....................................................................................... ii
HALAMAN JUDUL .......................................................................................... ii
SURAT PERNYATAAN .................................................................................. iii
HALAMAN PENGESAHAN ........................................................................... iv
ABSTRAK .......................................................................................................... v
ABSTRACT........................................................................................................ vi
KATA PENGANTAR ...................................................................................... vii
DAFTAR ISI ................................................................................................... viii
DAFTAR GAMBAR ......................................................................................... x
DAFTAR TABEL ............................................................................................. xi DAFTAR RUMUS ........................................................................................... xii
BAB I PENDAHULUAN
1.1 Latar Belakang ............................................................................................. 1
1.2 Identifikasi Masalah .................................................................................... 4
1.3 Batasan Masalah ......................................................................................... 4
1.4 Rumusan Masalah ....................................................................................... 5
1.5 Tujuan Penelitian ........................................................................................ 5
1.6 Manfaat Penelitian ...................................................................................... 6
1.6.1 Manfaat Teoritis .......................................................................................... 6
1.6.2 Manfaat Praktis ........................................................................................... 7
BAB II KAJIAN PUSTAKA
2.1 Knowledge Discovery In Database (KDD) .................................................. 8 2.2 Data Mining .............................................................................................. 10
2.2.1 Manfaat Data Mining ................................................................................ 11
2.2.2 Fungsi Data Mining ................................................................................... 11
2.2.3 Penerapan Data Mining ............................................................................. 12
2.2.4 Teknik Pembelajaran Data Mining ............................................................ 13
2.2.5 Kategori Data Mining ............................................................................... 14
2.3 Metode Data Mining.................................................................................. 14
2.3.1 Classification (Klasifikasi) ........................................................................ 15 2.3.2 Pohon Keputusan ...................................................................................... 16
2.3.3 Algoritma C4.5.......................................................................................... 18
2.4 Software Pendukung ................................................................................. 19
2.4.1 Waikato Environment for Knowledge Analysis (WEKA) ........................... 19
2.5 Penelitian Terdahulu ................................................................................. 20
2.6 Kerangka Pemikiran .................................................................................. 24
BAB III METODE PENELITIAN
3.1 Desain Penelitian......................................................................................... 26
3.2 Teknik Pengumpulan Data .......................................................................... 28
3.3 Operasional Variabel .................................................................................. 29 3.4 Metode Perancangan Sistem ....................................................................... 30
viii
3.5 Lokasi dan Jadwal Penelitian ..................................................................... 31
3.5.1 Lokasi Penelitian ....................................................................................... 31
3.5.2 Jadwal Penelitian ....................................................................................... 32
BAB IV HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian ............................................................................................ 33 4.2 Pembahasan ................................................................................................. 34
4.3 Analisa Data ................................................................................................ 34
4.3.1 Pembersihan data ...................................................................................... 35
4.3.2 Seleksi data ............................................................................................... 35
4.3.3 Transformasi data ...................................................................................... 38
4.3.4 Pohon keputusan ....................................................................................... 42
4.3.5 Pengujian menggunakan Aplikasi WEKA ................................................. 56
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan .................................................................................................. 61
5.2 Saran ............................................................................................................ 62
DAFTAR PUSTAKA
LAMPIRAN
1. Pendukung Penelitian
2. Daftar Riwayat Hidup 3. Surat Keterangan Penelitian
ix
DAFTAR GAMBAR
Halaman
Gambar 4. 1 Pohon Keputusan Node 1.............................................................. 49
Gambar 4. 2 Pohon Keputusan Node 2.............................................................. 52
Gambar 4. 3 Pohon Keputusan Node 3.............................................................. 55
Gambar 4. 4 Format Data Microsoft Excel ....................................................... 56
Gambar 4. 5 Halaman Awal aplikasi WEKA .................................................... 57
Gambar 4. 6 Membuka Data Pada Aplikasi WEKA .......................................... 57
Gambar 4. 7 Pemilihan Variabel Pada Aplikasi WEKA .................................... 58
Gambar 4. 8 Pemilihan Model Classify ............................................................. 58
Gambar 4. 9 Classify Output pada WEKA ........................................................ 59
Gambar 4. 10 Visualize Tree Pada WEKA ........................................................ 59 Gambar 4. 11 Hasil Visualize Tree WEKA ....................................................... 60
x
DAFTAR TABEL
Halaman
Tabel 3. 1 Jadwal Penelitian .............................................................................. 32
Tabel 4. 1Format Data Penjualan ....................................................................... 36
Tabel 4. 2 Klasifikasi Atribut Harga .................................................................. 38
Tabel 4. 3 Klasifikasi Atribut Kapasitas RAM .................................................. 39
Tabel 4. 4 Klasifikasi Atribut Prosessor ............................................................. 39
Tabel 4. 5 Klasifikasi Atribut Ukuran ............................................................... 39
Tabel 4. 6 Klasifikasi Daya Tahan Batrai ......................................................... 40
Tabel 4. 7 Format Data Pra-Proses Penjualan .................................................... 40
Tabel 4. 8 Hasil Perhitungan Node 1.................................................................. 48
Tabel 4. 9 Hasil Perhitungan Node 2................................................................. 52
Tabel 4. 10 Hasil Perhitungan Node 3 ................................................................ 54
xi
DAFTAR RUMUS
Halaman
Rumus 2. 1 Perhitungan Gain........................................................................... 18
Rumus 2. 2 Perhitungan Entrophy ..................................................................... 19
xii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Perkembangan globalisasi saat ini sangat mempengaruhi berbagai bidang,
salah satunya yaitu bidang teknologi. Perkembangan teknologi yang semakin
pesat dan memamasuki fase society 5.0. Dari sisi kehidupan, teknologi juga
sangat dibutuhkan untuk dapat membantu dan mempermudah pekerjaan. Barang-
barang elektronik pun tidak lagi menjadi barang mewah saat ini. Dampak positif
perkembangan teknologi di fase society 5.0 yakni menjadikan manusia semakin
cerdas, individual, serta memiliki harapan yang tinggi karena dengan mudah
terhubung langsung ke dunia global yang menyajikan data–data terbaru. Harapan
tersebut akan terlihat ketika manusia dilihat dari sisi konsumtifnya. Mereka akan
mencari barang yang paling cocok dengan kriteria mereka, untuk memenuhi
kebutuhan seiring perkembangan zaman. Barang – barang elektronik juga telah
mengalami perkembangan seperti televisi, telepon, komputer dan laptop.
Laptop atau komputer tenteng merupakaan sebuag komputer yang dapat
dibawah kemana saja serta memiliki ukuran kecil dan ringan, tergantung pada
ukuran, bahan, dan spesifikasi laptop tersebut. Laptop juga sering disebut dengan
komputer notebook atau notebook saja. Laptop mempunyai kegunaaan mirip
dengan komputer desktop (Desktop Computers) seperti umumnya yaitu dapat
1
2
memudahkan mengerjakan tugas dan pekerjaan dengan kilat dan baik. (Ginting,
2015). Disamping itu juga dengan adanya laptop dapat digunakan untuk
menambah penghasilan dengan banyaknya penjualan secara online. Bagi kalangan
anak muda, ada kalanya untuk hiburan dengan banyaknya game yang ditawarkan.
Oleh sebab itu, Laptop bukan lagi menjadi barang mewah. Laptop juga sudah
menjadi aspek penting dari kebutuhan berbagai kalangan seperti karyawan,
pembisnis, dan siswa maupun mahasiswa untuk menunjang pekerjaan maupun
studinya.
Toko Good Cell Batam yang beralamat di Lantai Dasar Blok K1 No. A2A-
Mitra Mall, Batu Aji Kota Batam ini adalah salah satu toko yang menyediakan
berbagai merk laptop. Toko Good Cell Batam termasuk toko yang paling ramai
dikunjungi oleh banyak orang yang akan membeli maupun sekedar tanya-tanya
laptop. Sehingga toko Good Cell Batam sering kali mengalami kesulitan dalam
membantu konsumen menentukan jenis dan tipe laptop yang akan dibeli. Hal ini
terjadi karena banyaknya jenis dan harga bersaing yang ditawarkan oleh pihak
produsen laptop. Untuk memilih laptop yang tepat sesuai dengan kebutuhan dan
dana yang disiapkan oleh konsumen, maka memerlukan suatu analisa yang akurat
yang dapat dijadikan bahan pertimbangan dari banyaknya kriteria dan faktor.
Kriteria - kriteria yang dapat dijadikan acuan dalam memilih suatu laptop antara
lain yaitu harga, kapasitas RAM, prosesor, ukuran dan daya tahan batrai dari
laptop tersebut. Untuk mengolah semua kriteria tersebut maka diperlukan suatu
sistem yang dapat menentukan dan mengelompokkan kriteria- kriteria yang dipilih
3
oleh konsumen, sehingga dapat membantu konsumen dalam memilih laptop yang
tepat.
Data mining merupakan suatu proses pengolahan data dengan teknik
statistik, matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan
yang terkait dari berbagai database besar. Data mining juga diartikan sebagai
proses untuk membangun hubungan, struktur dan model baru yang dapat
digunakan dalam penyeleksian data yang sangat besar. Salah satu teknik dari data
mining adalah klasifikasi. (Seng Hansun, 2014)
Algoritma C45 merupakan algoritma yang banyak dimanfaatkan dalam
proses pengklasifikasian pohon keputusan sebab mempunyai kelebihan utama
dibandingkan algortitma lainnya. Kelebihan algoritma C45 dapat menghasilkan
pohon keputusan yang mudah diinterprestasikan, mempunyai angka kebenaran
yang bisa diterima, efisien dalam menangani atribut bertipe diskret dan dapat
menangani atribut bertipe diskret dan numerik. (Seng Hansun, 2014)
Pengolahan data mining menggunakan metode algoritma C45 yang
bertujuan untuk memperoleh informasi berupa pemilihan laptop. Maka penulis
tertarik untuk melakukan penelitian dengan judul “Penerapan Data Mining
Dalam Pemilihan Laptop Menggunakan Algoritma C4.5” berdasarkan latar
belakang yang telah dijelaskan sebelumnya.
4
1.2 Identifikasi Masalah
Berdasarkan latar belakang yang sudah dipaparkan diatas, maka terdapat
beberapa identifikasi masalah dalam penelitian ini yaitu sebagai berikut:
1. Jenis laptop yang banyak mengakibatkan sulit dalam memilih laptop yang
tepat.
2. Tidak ada acuan dalam menentukan pilihan laptop yang tepat
berdasarkan kebutuhan konsumen.
3. Tidak ada pemanfaatan dari data arsip toko yang lama sebagai tolak ukur
dalam pemilihan laptop yang tepat bagi konsumen.
1.3 Batasan Masalah
Demi menjauhi adanya kekeliruan dari tema serta maksud semestinya,
sehingga perlu ditetapkan batasan terhadap masalah yang akan dibahas, antara
lain sebagai berikut:
1. Penelitian ini dilakukan di toko Good Cell Batam.
2. Pengujian pada penelitian ini menggunakan aplikasi WEKA.
3. Data yang digunakan dalam penelitian ini yaitu data penjualan toko Good
Cell selama 3 tahun dari tahun 2018 hingga 2020.
5
1.4 Rumusan Masalah
Beralaskan paparan dari latar belakang diatas, maka dapat disimpukan suatu
masalah dalam penelitian ini yang akan diteliti yaitu sebagai berikut:
1. Bagaimana teknik data mining mengetahui jenis laptop yang tepat untuk
konsumen?
2. Bagaimana penerapan data mining khususnya teknik klasifikasi
menggunakan metode algoritma c45 dalam menentukan pilihan laptop pada
toko Good Cell Batam?
3. Bagaimana teknik klasifikasi menggunakan algoritma c45 dalam
menentukan pola pemilihan laptop terhadap konsumen yaitu berupa pohon
keputusan yang terbentuk dari perhitungan entropy dan gain?
1.5 Tujuan Penelitian
Berdasarkan rumusan masalah yang telah diuraikan diatas, maka tujuan
yang akan dicapai oleh penelitian ini yaitu sebagai berikut:
1. Untuk mengetahui penerapan data mining yang digunakan dalam
menentukan pilihan laptop yang tepat bagi konsumen toko Good Cell.
2. Untuk mengurangi resiko kesalahan pilih laptop pada toko Good Cell.
6
3. Untuk memperoleh keputusan tentang acuan dan standar dalam pemilihan
laptop yang sesuai dengan keinginan maupun kemampuan konsumen
dengan menggunakan metode dalam data mining yaitu algoritma c45.
1.6 Manfaat Penelitian
Penelitan ini diharapkan berguna bagi pembaca. Manfaat dari penelitian
yang dilakukan ini dibagi menjadi dua bagian yaitu sebagai berikut:
1.6.1 Manfaat Teoritis
Manfaat teoritis yang diharapkan dapat diperoleh dari penelitian ini adalah
sebagai berikut:
1. Menetapkan konsep berkenaan algoritma c4.5 dalam mnunjukkan
pemilihan laptop pada toko Good Cell Batam.
2. Sebagai tambahan sumber pada penelitian-penelitian dimasa akan datang
yang memiliki kaitan erat dengan teknik data mining dengan metode
algoritma c45.
3. Dapat memperluas ilmu tentang data mining khususnya algoritma c45
dalam hal data-data yang selama ini dianggap tidak berguna atau dibuang
oleh pihak pemilik data tersebut.
7
1.6.2 Manfaat Praktis
Selain manfaat teoritis, maka ada juga manfaat praktis yang diharapkan
dapat diperoleh dari penelitian ini adalah sebagai berikut:
1. Dapat difungsikan sebagai tolak ukur untuk menentukan pemilihan laptop
yang tepat di toko Good Cell Batam sehingga dapat memberikan kepuasan
bagi konsumen saat membeli.
2. Memberikan saran kepada toko Good Cell Batam dalam menentukan
pemilihan laptop perlu adanya kriteria-kriteria standar yang diterapkan.
3. Memperoleh ilmu baru tentang teknik data mining khususnya metode
algoritma c45 dalam menentukan pemilihan laptop yang tepat supaya pihak
toko Good Cell Batam dapat meningkatkan kualitas pelayanan terhadap
konsumen.
BAB II
KAJIAN PUSTAKA
2.1 Knowledge Discovery In Database (KDD)
Knowledge Discovery in Database (KDD) adalah merupakan metode dalam
mendapatkan keahlian basis data yang ada. Dalam database diperoleh grafik-
grafik yang saling terhubung satu sama lainnya. Pengambilan keputusan dari hasil
keahlian yang didapatkan melalui tahapan yang berguna sebagai basis
pengetahuan (knowledge base). Istilah Knowledge Discovery in Database (KDD)
dan data mining biasanya dimanfaatkan secara bergantian dalam memperjelas
tahapan penggalian informasi tertanam pada database besar. Dari kedua
perumpamaan tersebut mempunyai ide tidak serupa namun memiliki keterikatan
diantaranya, dan satu diantaranya yaitu bagian dari keseluruhan prosedur
Knowledge Discovery in Database (KDD) adalah data mining. (Mardi, 2018)
Tahapan Knowledge Discovery in Database (KDD) secara ilustrasi bisa
dijalaskan sebagai berikut:
1. Data Selection
Sebelum proses penggalian informasi Knowledge Discovery in Database
(KDD) dimulai, maka diperlukan proses penyeleksian data dari sekelompok data
operasional. Hasil dari penyeleksian data tersebut disimpan kedalam berkas
terpisah dari database operasional untuk proses data mining.
8
9
2. Pre-processing / Cleaning
Tahapan pembersihan data pada saat fokus Knowledge Discovery in
Database (KDD) dilaksanakan sebelum proses data mining dimulai. tahapan
penyortiran data meliputi yaitu penyortiran data ganda, mendalami inkosisten
data, dan mengubah data yang salah cetak. Selain itu juga ada proses enrichment,
adalah data atau informasi luar yang dibutuhkan oleh Knowledge Discovery in
Database (KDD) yang valid melalui tahapan memperbanyak data yang telah
diketahui sebelumnya.
3. Transformation Coding
Tahapan coding dalam Knowledge Discovery in Database (KDD) ialah
prosedur yang bergantung pada macam atau bentuk dari informasi yang akan
dicari pada database serta prosedur transmutasi atas berita yang sudah diambil
berdasarkan kemauan pada data mining.
4. Data Mining
Data mining merupakan suatu cara dalam mencari sketsa serta berita
menarik dalam yang telah terpilih oleh teknik dan metode tertentu. Data mining
memiliki banyak teknik dan metode atau algoritma yang beranekragam sehingga
pemilihan metode dan algoritma yang tepat sangat bergantung pada hasil dan
tahapan dari Knowledge Discovery in Database (KDD) secara keseluruhan.
5. Interpretation / Evaluation
Bentuk informasi dari proses data mining yang telah diperoleh yaitu harus
memiliki bentuk yang sederhana yang gampang dipahami oleh pihak yang
bersangkutan. Proses ini adalah bagian dari Knowledge Diccovery in Database
10
(KDD) yang diartikan sebagai interpretation. proses ini mencakup pemeriksaan
apakah sketsa atau berita yang didapatkan bertolak belakang dengan fakta atau
hipotesis sebelumnya tang sudah ada. (Mardi, 2018)
2.2 Data Mining
Data mining memanfaatkan prosedur khusu untuk memperoleh skema
maupun berita merampas atas sebuah berita. Tahapan dari Data mining yang
digunakan dalam mengekstrak serta mengidentifikasi suatu informasi yang
dibutuhkan oleh database besar dengan cara teknik statistik, matematika,
kecerdeasan buatan, dan machine. (Mardi, 2018)
Tahapan induk dari kumpulan informasi yang dimana didalam nya terlibat
beberapa bidang yaitu bidang bidang ilmu statistik, mesin pembelajaran, dan
sistem managemen database dalam pemanfaatan algoritma serta dipergunakan
untuk menghasilkan data tersembuyi dalam suatu database yang besar merupan
pengertian dari data mining. (Yanto & Khoiriah, 2015)
Data mining merupakan sebuah cara yang dibantu oleh metode statistik
matematika, kecerdasan buatan, dan machine learning untuk menghasilkan dan
membuktikan berita yang bermanfaat serta ilmu yang berhubungan dengan
database besar. Data mining juga dapat diartikan sebagai rangkaian cara pada
proses penggalian data yang besar serta nilai tambah suatu kelompok data yang
merupakan ilmu yang tidak diketahui secara manual selama ini. (Faisal, 2019)
11
2.2.1 Manfaat Data Mining
Dalam data mining terdapat 2 dimensi, yaitu dimensi komersial dan dimensi
keilmuan. (Vulandari, 2017) yaitu sebagai berikut:
1. Dari dimensi komersial, penggunaan data mining dapat peruntukkan
menanggapi meluapnya isi data, dengan cara memanfaatkan metode
komputasi sehingga dapat memperoleh berita-berita yang diperlukan aset
supaya dapat menaikkan daya saing suatu kelompok.
2. Dari dimensi keilmuan, data mining dimanfaatkan dalam menggambar,
mengaanalisis serta mengamankan besar yang berkarakter realtime.
2.2.2 Fungsi Data Mining
Manfaat-manfaat yang sering dipergunakan pada data mining menurut
haskett 2000 (Vulandari, 2017), sebagai berikut:
1) Assosiation, merupakan tahapan yang digunakan dalam memperoleh
kebijakan asosiasi kombinasi barang pada suatu waktu.
2) Sequence, merupakan tahapan yang digunakan untuk menenukan kebijakan
asosiasi kombinasi barang dalam waktu banyak.
3) Clustering, merupakan tahapan dari kumpulan data serta memiliki
kumpulan database sama.
4) Classification, merupakan tahapan yang digunakan untuk membedakan
struktur maupun kelas data yang bertujuan supaya objek tersembunyi.
12
5) Regression, merupakan tahapan pembagian berita marka perkiraan.
6) Forecasting, merupakan pembedaan nilai perkiraan dari sekelompok
bentuk.
7) Solution, merupakan penemuan biang masalah yang dihadapi untuk
pemugutan kesimpulan.
2.2.3 Penerapan Data Mining
Menurut (Vulandari, 2017), penerapan data mining terdiri dari 3 penerapan
yaitu sebagai berikut:
1. Analisa Pasar Dan Manajemen
Asal mula berita atas diaplikasikan seolah negosiasi nota utang, nota
kelompok group eksklusif, nota potongan, protes konsumen, ditingkatkan via
belajar mengenai konsep tumbuh masa. Macam-macam jalan keluar yang bisa
diatasi oleh data mining antara lain:
a) Menghabisi sasaran market
b) Melihat kodisi daya beli dimasa depan
c) Analisis lintas pasar
d) tentang costumer
e) Melihat keperluan costumer
f) Mengapresiasi kelayakan custumer
g) Berita pendapatan
2. Analisa Perusahan Dan Manajemen Resiko
13
a) Perencanaan keuangan dan evaluasi aset
b) Perencanaan sumber daya
c) Persaingan
3. Telekomunikasi
Data mining digunakan untuk meningkatkan pelayanan langsung dengan
banyaknya penjualan yang diterima serta menyortir penjualan yang harus dilayai
secara manual.
2.2.4 Teknik Pembelajaran Data Mining
Terdapat tiga metode utama yang merupakan bagian dari metode data
mining yang sangat erat dengan penemuan (discovery) dan pembelajaran
(learning) yaitu :
1. Supervised Learning
Supervised learning adalah metode yang sering dipergunakan. Metode ini
juga disebut “Programming By Example”. Metode ini sangat bergantung tahapan
latihan pada data historis yang memiliki bagian-bagian pemetaan terdahap hasil
pengolahan algoritma data mining.
2. Unsupervised Learning
Metode ini kebalikan dari metode supervised learning. Metode ini sangat
bergantung kepada pemanfaatn algoritma yang mendeteksi semua bentuk, seperti
assosiation dan sequence, yang ada pada spesifik dalam data pemasukan.
3. Reinforcement Learning
14
Metode ini memiliki control adaptif namun paling jarang digunakan.
2.2.5 Kategori Data Mining
(Vulandari, 2017) Data mining terdiri dari 2 kategori utama yaitu seperti
berikut:
1. Prediktif
Berfungsi dalam menentukan nilai atribut tertentu yang dilihat dari atribut-
atribut lainnya.
2. Deskriptif
Berfungsi dalam menentukan bentuk maupun struktur dalam merangkum
hubungan utama dalam data.
2.3 Metode Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan (Mardi, 2018), yaitu:
1. Description (Deskripsi)
Deskripsi merupakan bentuk dari kecenderungan yang sering memberikan
kemungkinan penjelasan dari suatu pola.
2. Estimation (Estimasi)
Estimasi merupakan hasil dari variabel target berdasarkan hasil prediksi
yang hampir sama fungsi nya dengan klasifikasi.
3. Prediction (Prediksi)
15
Prediksi ini sendiri memmiliki kemiripan dengan klasifikasi dan estimasi,
tetapi prediksi lebih mengarah ke hasil dimasa yang akan datang.
4. Classification (Klasifikasi)
Merupakan bagaian dari kategori yang dikelompokkan menjadi beberapa
bagian.
5. Clustering (Pengklusteran)
Merupakan kumpulan objek-objek yang hampir sama satu dengan yang
laiinnya serta memiliki ketidaksamaan dengan objek dri kelompok lainya
6. Association (Asosiasi)
Merukan bagian dari data mining yang dari menemukan item yang muncuk
dalam watu yang bersamaan.
Berdasarkan penjelasan dari beberapa kelompok yng telah dijelaskan diatas,
maka metode dari teknik data mining yang akan digunakan dalam penelitian ini
yaitu menggunakan teknik Classification (Klasifikasi).
2.3.1 Classification (Klasifikasi)
Proses pengklasifikasian merupakan salah satu pekerjaan dari data mining.
Kemunculan klasifikasi awalnya dilakukan pada bagian tanaman yang dilakukan
pada bentuk tertentu, seperti (Carolus Linnaeus) yang dilakukan oleh Carolus von
Linne yang mulanya tidak diketahui nama pada saat pengklasifikasian bentuk
berdasarkan karakter fisik. Selanjutnya dia dikenal sebagai bapak klasifikasi.
Beberapa metode klasifikasi umum digunakan dalam data mining adalah: Pohon
16
keputusan, Pengklasifikasi bayes/naive bayes, Jaringan saraf tiruan, Analisis
statistik, Algoritma genetik, Rough sets, Pengklasifikasi k-nearest neighbour,
Metode berbasis aturan, Memory based reasoning, Support vector machine.
(Faisal, 2019)
Klasifikasi data merupakan proses pengklasifikasian dalam ruang yang
berbeda-beda yang ditetapkan sebagai model klasifikasi dari sebuah database
yang berupa pola-pola yang ditemukan oleh himpunan obyek. Klasifikasi itu
sendiri memiliki tujuan yaitu pola dari training set kedalam kelopok atau kelas
yang sesuai berdasarkan atribut yang berbeda-beda, pola tersebut selanjutnya
digunakana untuk pengklasifikasian atribut dengan kelas yang belum diketahui
sebelumnya. (Azwanti, 2018)
2.3.2 Pohon Keputusan
Pohon keputusan dikenal sebagai contoh bentuk pohon (tree) yang mana
setiap node mencontohkan atribut, cabangnya mencontohkan nilai dari atribut dan
daun mencontohkan kelas. Root merupakan pohon keputusan paling atas dari
sebuah node. Pohon keputusan memiliki keuntungan dalam mengekstrak dan
mencontohkan bentuk dalaam klasifikasi aturan if-then salah satunya adalah C4.5
(Azwanti, 2018)
Pohon keputusan atau decission tree adalah beberapa metode dari teknik
data maning yang dimanfaatkan sebagai pengklasifikasian. Pohon keputusan
adalah aturan yang sangat gampang dipelajari dengan bahasa sehari-hari serta
dapat merubah kebenaran yang besar menjadi sebuah merepresentasikan aturan.
17
Sebuah pohon keputusan adalah sebuah konsep yang dapat dimanfaatkan dalam
proses pembagian elemen-elemen data besar menjadi sebuah tumpukan record
yang berukuran mini yang diterapkan sebagai serangkaian aturan keputusan.
Salah satu algortima yang dimanfaatkan untuk pembentukan pohon keputusan
yaitu algoritma C4.5. (Faisal, 2019)
Pola dari pohon kesimpulan sengaja disamakan dengan arsitektur yang ada
apa sebuah pohon dan penegsannya, ialah seperti berikut ini:
1. Simpul bagian akar
Merupakan bagian akar paling atas dari pola pada pohon keputusan.
2. Simpul internal
Merupakan bagian cabang lanjutan dari simpul akar. Simpul ini akan
mengeluarkan simup maksimal 2 dari 1 simpul yang dimasukkan.
3. Simpul daun
Merupakn bagian palingujung dari semua pohon yang tidan memiliki
turunan atau keluaran.
Struktur poko kesimpulan memiliki tiga macam node yaitu (Elisa &
Ervina, 2018) :
1. Rood Node yaitu node pertama adalah node yang mempunyai input namun
tidak mempunyai output tetapi banyak output juga.
2. Internal Node yaitu node pembagian adalah node dengan 1 input dan output
yang banyak.
3. Leaf Node yaitu node akhir adalah node dengan input saja.
18
2.3.3 Algoritma C4.5
Salah satu algoritma dalam membentuk suatu pokok kesimpulan yang biasa
dipakai adalah algoritma C4.5. Algoritma C4.5 adalah pengembangan atas ID3,
pengembanganya untuk melumpuhkan nilai yang hilang, biasanya melumpuhkan
data selanjutnya serta harapan. Algoritma C4.5 merupakan metode untuk
menstruktur sebuah pohon keputusan berkenaan dengan berita yang didapatkan
terlebih dahulu. Gaya pertama yang melandasi algoritma ini adalah
pengstrukturan potoh kesimpulan berkenaan gaya cabang yang memiliki marka
gain tertinggi berkenaan dengan marka entropy cabang tersebut semisal under
step dari algoritma ini yaitu mempunyai nilai gain tertinggi berdasarkan nilai
entrophy bagian dari proses pengklasifikasian. Rumus gain tertinggi dapat dilihat
sebagai berikut ini (Elisa & Ervina, 2018) .
1) Perhitungan Gain Tertinggi
𝑛
𝐺𝑎𝑖𝑛 (𝑆, 𝐴 ) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ 𝑖=1
𝑆𝑖
𝑆
∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆𝑖)
Dimana:
S : Himpunan kasus
A : Atribut
N : Jumlah partisi atribut A
|Si| : Jumlah kasus pada partisi ke-i
|S| : Jumlah kasus dalam S
Rumus 2. 1 Perhitungan Gain
19
Selanjutnya melakukan perhitungan nilai entrophy dapat disimak pada
persamaan berikut ini:
Dimana:
S : Himpunan kasus
A : Fitur
N : Jumlah partisi S
𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ 𝑖=1
− 𝑃𝑖 ∗ 𝑙𝑜𝑔2𝑃𝑖
Rumus 2. 2 Perhitungan Entrophy
Pi : Proporsi dari Si terhadap S
2.4 Software Pendukung
2.4.1 Waikato Environment for Knowledge Analysis (WEKA)
Waikato Environment for Knowledge Analysis adalah sebuah kelompok alat
pembelajaran mesin praktis yang disingkat WEKA. Aplikasi ini diciptakan di
Universitas Waikato, New Zealand bagi ulasan, keahlian dan macam-macam
aplikasi. Keuntungan menggunakan WEKA yaitu khususnya klasifikasi yang
dilandasi oleh pendekatan-pendekatan sangat mampu menyelesaikan masalah-
masalah data mining dalam dunia nyata. Selain itu WEKA juga sangat gampang
diterapkan dibeberapa tahapan berbeda dan WEKA menyediakan alat untuk pre-
processing data, klasifikasi, regresi, clustering, aturan asosiasi, dan visualisasi.
Ada beberapa metode dari data mining yang bisa dieksekusi menggunakan
20
aplikasi WEKA yang sering digunnakan yaitu pohon keputusan (decision tree).
Kontruksi dai pohon keputusan yang melibatkan node keputusan yang akan
disambungkan ke setiap bagian-bagian mulai simpul akar sampai ke node daun
(akhir) merupakan bagian yang menarik dari metode klasifikasi. Pada node
kesimpulan indikasi bakal dites, lalu tiap-tiap reaksi atas memperoleh bagian.
Tiap-tiap bagian akan ditunjukkan ke node lain atau ke node akhir untuk
mendapatkan hasil yaitu berupa keputusan. (Pujiono, Amborowati, & Suyanto,
2013)
2.5 Penelitian Terdahulu
Penelitian terdahulu merupakan acuan dalam sebuah penelitian. Peneliti
juga menemukan beberapa hasil penelitian terdahulu yang berhungan dengan
algoritma C4.5 antara lain sebagai berikut:
1. (Mardi, 2018) dalam jurnal yang berjudul “Data Mining : Klasifikasi
Menggunakan Algoritma C4.5” menyatakan bahwa Knowledge Discovery
in Database (KDD) merupakan bagian teringgi dari data mining, dimana
data dengan jumlah yang sangat besar dapat diolah kedalam data mining
dengan melakukan berbagai metode untuk memperoleh sebuah berita seperti
pengklasifikasian maupun memprediksi. Pohon keputusan yang dihasilkan
melalui algoritma C4.5 agar gampang dimengerti adalah bagian dari
klasifikasi dalam data mining.
2. (Novianti & Bahri, Tedy Rismawan, 2016) dalam jurnal berjudul
“Implementasi Data Mining Dengan Algoritma C4.5 Untuk Penjurusan
21
Siswa (Studi Kasus: Sma Negeri 1 Pontianak)” menyatakan bahwa
klasifikasi penjurusan siswa berdasarkan penggolongan siswa berdasarkan
kemamampuan (nilai), bakat serta minat yang hampir sama sehingga
pembelajaran yang akan diajarkan akan lebih fokus dan teratur. Salah satu
institusi pendidikan yang berada di kota Pontianak yaitu SMA Negeri 1
dimana sekolah tersebut memilik dua penjurusan yaitu IPA dan IPS.
Kurikulum 2013 saat ini yang mengatur proses penyeleksian berdasarkan
nilai rata-rata rapor SMP, nilai UAS SMP serta nilai tes MTK,IPA dan IPS.
Metode algoritma C4.5 dimanfaatkan sebagai proses dalam
pengklasifikasian data sehingga mampu menghasilkan pohon keputusan
berdasarkan proses penyeleksian data sebelumnya sehingga menghasilkan
tingkat akurasi sebesar 89.74%.
3. (Mirqotussa’adaha, Much Aziz Muslima & Budi Prasetiyoa, 2017) dalam
jurnal yang berjudul “Penerapan Dizcretization dan Teknik Bagging
Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada
Algoritma C4.5 dalam Mendiagnosa Diabetes” menyatakan bagi aspek
bakal kesehatan, data mining bakal difungsikan dalam memperkirakan
suatu penyakit dari data rekam medis pasien. Sehingga digunakan untuk
meningkatkan ketetapan algoritma pengkelompokkan dalam merancang
berbagai classifier dari data training dalam mematenkan discretization dan
teknik bagging untuk klasifikasi berbasis ensemble pada algoritma C4.5
dapat meningkatkan akurasi sebesar 6,26%. Hasil ketetapan dari 68,61%,
kemudian ditetapkan discretization dan metode bagging menjadi 74,87%.
22
4. (Purwadi, 2018) dalam jurnal yang berjudul “Implementasi Data Mining
Untuk Memprediksi Pola Pembelian Sepeda Motor Pada Showroom Cv.
Viva Mas Motors Dengan Metode Algoritma C4.5” menyatakan bahwa
kecenderungan kelakuan konsumen dalam memilih sepeda motor menjadi
bagian yang perlu di prediksi dengan menganalisa produksi sepeda motor
yang semakin kompetitif. Fakta menyatakan bahwa permsalahan pola
pembelian terdahap sepeda motor merupakan bagian yang akan diolah.
metode Algoritma C4.5 bagian dari data mining ini digunakan untuk
memprediksi pola pembelian sepda motor. field merk, tahun, dan harga
merupakan variabek yang mempengaruhi pemilihan sepeda motor sehingga
variabel iniakan dihitung nilai entropy serta gain terbesar sehingga dapat
menghasilkan root dari tree.
5. (Nurul Aswanti, 2018) dalam jurnal yang berjudul “Penerapan Algoritma
C4.5 Untuk Memprediksi Besarnya Penggunaan Listrik Rumah
Tangga Di Kota Batam” menyatakan bahwa Listrik sudah menjadi
kebutuhan manusia dalam kegiatan sehari-hari. Penggunaan listrik mulai
dari peralatan rumah tangga seperti kulkas, kipas angin, mesin cuci hingga
alat komunikasi seperti handphone, laptop dan berbagai macam alat
elektronik lainnya yang sangat membutuhkan energi listrik. Batam
merupakan salah satu kota besar dan padat di Indonesia salah satunya
daerah Batam Center. Akibat kepadatan penduduk tersebut menyebabkan
kebutuhan energi listrik meningkat. PT PLN Batam (b’right) merupakan
perusahaan dikota batam yang menyediakan sumber energi listrik. Dalam
23
kasus ini sangat diperlukan suatu teknik yang bisa digunakan untuk
memprediksi penggunaan listrik rumah tangga supaya program pemerintah
dalam upaya penghematan energi listrik dapat tercapai. Salah satu teknik
yang dapat digunakan dalam kasus ini yaitu teknik data mining dengan
melakukan klasifikasi menggunakan metode algoritma C45. Hasil yang
dicapai dari metode algoritma C45 berupa pohon keputusan dimana variabel
jumlah anggota keluarga, luas bangunan rumah dan lama waktu dirumah
menjadi variabel penting dari prediksi besarnya pemakaian listrik. Pengujian
dilakukan menggunakan Weka yang menghasilkan rule yang sama dengan
pohon keputusan yang terbentuk.
6. (Hilda Amalia, 2017) dalam jurnal yang berjudul “Penentuan Proses
Persalinan Ibu Melahirkan Menggunakan Algoritma C4.5” menyatakan
bahwa melahirkan merupakan sebuah karunia yang dirasakan oleh semua
ibu. Proses persalinan ada dua macam yaitu normal dan operasi keduanya
memiliki tujuan yang sama yaitu keselamatan ibu dan anak. Oleh sebab itu
diperlukan suatu teknik dari data mining, sehingga dapat menghasilkan
prediksi proses persalinan ibu melahirkan. Algoritma C4.5 merupakan salah
satu teknik data mining yang mampu menghasilkan pohon keputusan.
Dengan adanya prediksi proses persalinan ini dapat dipilih proses
melahirkan yang tepat sehingga dapat terhindar dari resiko persalinan.
Dalam penelitian ini akan dilakukan pengolahan data-data kesehatan ibu
melahirkan dengan algoritma c4.5 diperoleh hasil akurasi sebesar 90%.
24
7. (Kurniawan, Wicaksono, & Astuti, 2016) dalam jurnal yang berjudul
“Pemanfaatan Educational Data Mining (Edm) Untuk Memprediksi
Masa Studi Mahasiswa Menggunakan Algoritma C4.5 (Studi Kasus: Ti-
S1 Udinus)” Menyatakan bahwa institusi pendidikan yang memiliki
ketersediaaan data yang banyak diharapkan dapat dimanfaatkan dengan
baik dan benar. Bentuk pembelajaran mahasiswa serta hubungan antar
atribut data pendidikan menjadi fokus dalam penelitian karena sangat
mempengaruhi data yang besar. Penerapan metode Algoritma C4.5 dari data
mining diharapkan dapat menemukan pola klasifikasi terhadap mahasiswa
dengan kelulusan tercepat dan kelulusan yang lambat serta perkiraan data yg
diuji. Sehingga Algoritma C4.5 mampu melakukan prediksi dengan
kebenaran yang baik (73,68%) terhadap masa studi mahasiswa dengan
kelulusan tepat waktu dan kelulusan lambat.
2.6 Kerangka Pemikiran
Struktur pemikiran merupakan suatu struktur yang menegaskan mengenai
jalan nalar yang nantinya akan dipergunakan dalam penelitian. Berikut ini adalah
gambaran dari struktur pemikiran dari penelitian ini:
25
Sumber: Data Peneliti (2021)
Data penjualan yang berusul dari hasil data rekapan penjualan laptop selama
3 tahun pada Toko Good Cell Batam menjadi data input dalam proses penelitian,
kemudian diolah kedalam metode algoritma C4.5, selanjutnya data yang telah
diolah dengan metode Algoritma C4.5 diuji menggunakan aplikasi WEKA,
sehingga menghasilkan output berupa hasil pemilihan laptop yang tepat bagi
konsumen maupun calon konsumen dari Toko Good Cell Batam.
Pemilihan Laptop Yang
Tepat
Pengolahan Data
Menggunakan
Metode algoritma
C4.5
Data Penjualan
Toko Good Cell
Batam
Implementasi Menggunakan
Aplikasi WEKA
BAB III
METODE PENELITIAN
3.1 Desain Penelitian
Sebelum masuk kebagian teknik penelitian, desain penelitian perlu
dirancang terlebih dahulu. Dengan tujuan untuk memudahkan penelitian ke
tahapan selanjutnya. Adapun Desaian penelitian dalam penelitian ini mulai dari
awal hingga akhir, yaitu dapat dilihat sebagai berikut:
Sumber: Data Penelitian (2021)
Berkenaan dengan desain penelitian diatas, penjelasannya dapat dilihat
sebagai berikut:
26
Pengolahan Data Menggunakan
Metode Algoritma C4.5
Penyeleksian Data Penjualan
Laptop Pada Toko Good Cell Batam
Pengumpulan Data Penjualan
Laptop Pada Toko Good Cell Batam
Hasil Penelitian pemilihan laptop
yang tepat Pada Toko Good Cell
Batam
Implementasi Dan Pengujian
Menggunakan Aplikasi WEKA
27
1. Pengumpulan Data
Proses ini dilakukan guna mendapatkan berita yang dibutuhkan dalam
penelitian guna mencapai tujuan yang diinginkan oleh peneliti. Data yang
diperoleh yaitu berupa data penjualan laptop Toko Good Cell Batam,
melalui wawancara, observasi dan study pustaka mengenai data mining serta
metode Algoritma C4.5.
2. Penyeleksian Data
Proses ini dilakukan guna menghasilakan data yang benar-benar sesuai
dengan kebutuhan serta tujuan penelitian yang nantinya akan dijadikan
sampel. Data yang dipilih yaitu berupa data-data Penjualan Laptop Pada
Toko Good Cell Batam dari tahun 2018 hingga 2020.
3. Pengolahan Data
Data yang telah melakukan proses penyeleksian sebelumnya, kemudian
akan diproses dan diolah kedalam teknik data mining dengan menggunakan
metode algoritma C4.5.
4. Implementasi
Aplikasi WEKA akan digunakan sebagai aplikasi yang digunakan dalam
pengujian untuk pemilihan laptop pada Toko Good Cell Batam.
5. Hasil Penelitian
Hasil yang menjadi tujuan dari penelitian ini adalah untuk menentukan
pemilihan laptop pada Toko Good Cell Batam yang telah diolah dengan
teknik data mining menggunakan metode algoritma C4.5 dengan proses
pengujian menggunakan aplikasi WEKA.
28
3.2 Teknik Pengumpulan Data
Teknik pengumpulan data dalam penelitian ini menggukan 3 teknik yaitu,
observasi, wawancara, dan studi pustaka. Penjelasan dari ketiga teknik
pengumpulan data yaitu sebagai berikut:
1. Observasi
Observasi merupakan serangkaian proses psikologis dan biologis yang
tersusun secara kompleks. Observasi dalam penelitian ini dilakukan secara
langsung pada Toko Good Cell Batam untuk melakukan pengamatan
terhadap data penjualan laptop serta mengetahui variabel-variabel yang
dibutuhkan dalam proses pengolahan data sebagai bahan dalam penelitian.
2. Wawancara
wawancara merupakan suatu proses untuk memperoleh informasi langsung
dari sumbernya. Dalam penelitian ini peneliti melakukan wawancara
langsung dengan karyawan Toko Good Cell Batam yang bertujuan untuk
memperoleh informasi tentang penjulan laptop serta kendala-kendala yang
sering mereka alami saat memberikan informasi yang tepat bagi konsumen
saat membeli laptop ditoko Toko Good Cell Batam.
3. Studi Pustaka
Pada penelitian ini, peneliti melakukan pengelompokkan beberapa sumber
sebagai partisan penelitian yang diperoleh dari buku-buku, jurnal dan dari
bermacam referensi yng memiliki keterikatan dengan obiek penelitian.
29
3.3 Operasional Variabel
Proses pengolahan data dilakukan sesuai dengan data penjualan laptop pada
Toko Good Cell Batam. Variabel – variabel yang diperlukan dalam proses analisa
data yaitu berdasarkan:
1. Harga
Harga merupkan aspek utama dalam membeli laptop, karena harga bisa
mengukur seberapa bagus laptop yang akan dibeli.
2. Kapasitas RAM
Kapasitas RAM merupakan salah satu faktor yang mempengaruhi kinerja
laptop. Kapasitas setiap laptop tentu berbeda. Semakin besar RAM yang
dipasang maka semakin besar juga tempat penyimpanan data. Oleh kerena
itu kapasitas RAM perlu diperhatikan saat membeli laptop.
3. Prosesor
Bagian yang tidak kalah penting dalam pemilihan laptop ialah prosesor.
Prosesor merupakan bagian dari dapur pacu. Ada beragam jenis prosesor
yang dijual di pasaran baik tipe AMD maupun Intel.
4. Ukuran Laptop
Ukuran layar yang dipilih saat membeli laptop baru, tentunya akan
memengaruhi ukuran laptop.
5. Daya Tahan Batrai
30
Rata-rata laptop yang dijual memiliki daya tahan baterai kisaran 6 - 8 jam.
Namun ketahanan baterai agak sulit diukur karena tergantung
pemakaian laptop.
Dari variabel-variabel yang telah disebutkan dan dijelaskan diatas, maka
keputusan yang akan dihasilkan yaitu Tepat dan Tidak Tepat.
3.4 Metode Perancangan Sistem
Bagian dari metode perancangan sistem pada penelitian ini dapat dilihat
sebagai berikut:
Sumber: Data Peneliti (2021)
Imlementasi Dan Pengujian Data
Menggunakan Aplikasi WEKA
Hasil Penelitian Pemilihan Laptop Yang
Tepat Pada Toko Good Cell Batam
Pengolahan Data Penjualan Toko Good
Cell Batam Menggunakan Metode
Algoritma C4.5
Hasil Seleksi Data Penjualan Toko Good
Cell Batam
Penyeleksian Data Penjualan Toko Good
Cell Batam
Data Penjualan Toko Good Cell Batam
31
Berkenaan dengan struktur dari perancangan sistem diatas, terlihat bahwa
tahapan pertama yang dilakukan pada penelitian ini yaitu memperoleh data
penjualan laptop dengan kriteria seperti harga, kapasitas RAM, prosesor, ukuran
dan daya tahan batrai dari laptop pada Toko Good Cell Batam, kemudian
dilakukan proses penyeleksian data hingga memperoleh data yang layak yang
akan diproses ke tahapan selanjutnya. Setelah memperoleh hasil penyeleksian data
telah selesai, maka data penjualan tersebut selanjutnya diolah kedalam teknik data
mining menggunakan metode algoritma C4.5, selanjutnya diuji dengan
menggunakan aplikasi WEKA, untuk mengetahui keakuratan antara proses
perhitungan manual tersebut sesuai dengan hasil pengujian melalui aplikasi
WEKA dalam menentukan pilihan laptop yang tepat berdasarakan data yang
diolah.
3.5 Lokasi dan Jadwal Penelitian
Pada penelitian ini, menunjukkan lokasi dan jadwal yang dilangsungkan
yaitu sebagai berikut:
3.5.1 Lokasi Penelitian
Penelitian ini dilangsungkan pada Toko Good Cell Batam yang beralamat
Lt. dasar Blok K1 No.A2A Mitra Mall Kec. Batu Aji, Kota Batam.
32
3.5.2 Jadwal Penelitian
Jadwal penelitian yang dilakukan pada penelitian ini yaitu selama enam
bulan dari bulan maret 2021 hingga agusus 2021, sesuai dengan jadwal yang
tercantum dikalender akademik Universitas Putera Batam, jadwal penelitian yang
dilakukan dapat dilihat pada tabel berikut:
Tabel 3. 1 Jadwal Penelitian
Kegiatan
Waktu Kegiatan
Maret 2021
April 2021
Mei 2021
Juni 2021
Juli 2021
Agustus 2021
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Pengajuan Judul
Penyususnan BAB I
Penyususnan BAB II
Penyususnan BAB III
Penyususnan BAB IV
Penyususnan BAB V
Pengumpula n
Skripsi
Sumber: Data Peneliti (2021)