Abstract -...
Transcript of Abstract -...
Identifikasi Kanker Serviks Dari Citra Papsmear Berbasis Kecerdasan Buatan
Winda Dwi Tanti1, Endah Purwanti2, Adri Supardi3
1,2,3 Program Studi S1 Teknobiomedik, Departemen Fisika, Fakultas Sains Dan Teknologi,
Universitas Airlangga, Surabaya
Abstract
The purpose of this research is to identify cervical cancer with shape features and
statistical features extraction using artificial intelligence system. The methods used in this
research are clustering fuzzy c – means and k – means into two groups, cluster 1 and cluster
2, followed by classifications of backpropagation into two classes, normal and abnormal. A
whole data images those used are 130 data abnormal and 65 data normal. Processing image
conducted include image pre-processing to improve the quality of the image, for the next
segmentation nucleus area. As many as 11 features consisted of two types has been extracted
from cervical cell binary images. The results showed from train processing that the
identification of cervical cancer by FCM – backpropagation methods provide better
accuracy than backpropagation methods, with value of accuracy 100% to 97%. Optimal
accuracy of classification system from this research is 84,44% with the parameter value of
neurons number in hidden layer 10 and learning rate 0,2.
Keywords: Single cervical cell images, cervical cancer, pap smear test, fuzzy c – means,
backpropagation
Abstrak
Penelitian ini bertujuan untuk identifikasi kanker serviks dengan ekstraksi fitur bentuk
dan histogram menggunakan sistem kecerdasan buatan. Metode yang digunakan yaitu
pengelompokan fuzzy c – means dan k – means menjadi dua kelompok, cluster 1 dan cluster
2, yang dilanjutkan dengan klasifikasi backpropagation menjadi 2 kelas, normal dan
abnormal. Keseluruhan data citra yang digunakan sebanyak 130 data abnormal dan 65 data
normal. Pengolahan citra yang dilakukan meliputi pengolahan awal sebagai langkah
meningkatkan kualitas citra yang diproses, untuk selanjutnya dilakukan segmentasi area
nukleusnya. Sebanyak 11 fitur yang terdiri atas 2 jenis diekstraksi dari citra biner sel serviks.
Hasil penelitian menunjukkan bahwa identifikasi kanker serviks dengan metode FCM –
bacpropagation memberikan nilai akurasi pelatihan yang lebih baik daripada metode
backpropagation, dengan nilai akurasi 100% banding 97%. Tingkat akurasi optimal sistem
klasifikasi yang dihasilkan dari penelitian ini yaitu 84,44% dengan nilai parameter jumlah
neuron pada hidden layer 10 dan nilai laju pembelajaran 0,2.
Kata kunci: Citra tunggal sel serviks, kanker serviks, tes papsmear, fuzzy c – means,
backpropagation
1. Pendahuluan
Kanker serviks merupakan penyakit yang menyerang organ reproduksi wanita yaitu
serviks atau leher rahim. Tahun 2013, diperoleh data kasus kanker serviks di seluruh dunia
sebanyak 453 ribu (13,1%) yang menjadikan kanker serviks penyebab kematian kedua pada
wanita [1]. Banyaknya kasus kanker serviks dikarenakan tidak dijumpainya gejala – gejala
yang spesifik seperti pada jenis kanker lain. Oleh sebab itu, dibutuhkan prosedur deteksi dini
dengan harapan dapat menekan jumlah penderita dan jumlah kematian karena kanker
serviks.
Salah satu jenis metode yang paling efektif untuk pemeriksaan sel serviks yaitu melalui
tes Papanicolau (Papsmear). Metode ini dilakukan dengan cara mengambil sampel dari sel
serviks pasien. Sampel sel tersebut kemudian dilakukan preparasi dan observasi dengan
bantuan mikroskop. Durasi pemeriksaan yang cukup lama, kurangnya sumber daya ahli
sitologi, kurangnya fasilitas lab, serta resiko terjadinya human error merupakan beberapa
kekurangan pada metode Papsmear [2]. Oleh sebab itu dibutuhkan suatu sistem otomasi
berbasis kecerdasan buatan yang dapat mengklasifikasikan sel serviks menjadi sel normal
atau sel abnormal dengan waktu yang relatif singkat.
Penelitian – penelitian yang memanfaatkan sistem kecerdasan buatan untuk deteksi dini
telah banyak dilakukan oleh peneliti sebelumnya. Jeremiah [3] menggunakan tiga macam
fitur sebagai data masukan klasifikasi tiga jenis metode yang berbeda sehingga
menyebabkan program memberikan respon yang lambat. Erlinda [4] menggunakan 7 fitur
dari sel serviks tunggal sebagai data input dalam sistem klasifikasi Learning Vector
Quantization (LVQ), dimana dihasilkan akurasi sebesar 93,33%. Atta [5] menggunakan tiga
jenis fitur untuk diagnosis penyakit katup jantung, dimana klasifikasi backpropagation
memberikan rata – rata hasil akurasi sebesar 93,75%.
Berdasarkan beberapa penelitian tersebut, maka dilakukan penelitian deteksi dini kanker
serviks dengan upaya meningkatkan hasil akurasi menggunakan sistem kecerdasan buatan.
Program yang dibuat meliputi segmentasi area nukleus, ekstraksi fitur bentuk dan fitur
histogram, dan klasifikasi menggunakan sistem kecerdasan buatan. Sistem kecerdasan
buatan yang digunakan yaitu clustering fuzzy c – means dan k – means menjadi 2 cluster,
dan klasifikasi backpropagation menjadi data normal dan data abnormal.
2. Dasar Teori
2.1 Median Filtering
Median filtering merupakan teknik perbaikan citra yang digunakan untuk mengurangi
adanya noise pada citra. Filter ini sangat efektif untuk menghilangkan noise jenis salt and
peper serta dapat mempertahankan detail citra karena tidak tergantung pada nilai – nilai yang
berbeda dengan nilai – nilai yang umum dalam lingkungannya [6].
2.2 Contrast Stretching
Teknik contrast stretching digunakan untuk memperbaiki kontras citra dengan cara
melebarkan intensitas pixel pada citra masukan, sedemikian sehingga dihasilkan citra dengan
rentang intensitas pixel yang lebih lebar [7].
2.3 Morphological Processing
Tujuan secara umum dari operasi morfologi pada citra biner adalah untuk memperbaiki
bentuk obyek, agar dapat menghasilkan fitur yang lebih akurat saat analisis obyek dilakukan.
Operasi dasar dalam morfologi citra yaitu dilasi dan erosi. Kedua operasi dasar tersebut
menjadi basis untuk membuat berbagai operasi morfologi yang sangat berguna untuk
pengolahan citra digital seperti opening, closing, hit and miss transform, thinning, dan
thickening [8].
2.4 Thresholding
Thresholding merupakan salah satu metode sederhana dari segmentasi citra yang
memiliki tujuan untuk membagi suatu citra menjadi beberapa daerah tertentu. Metode ini
membagi daerah citra berwarna atau grayscale menjadi citra dengan dua nilai tingkat
keabuan, yaitu hitam dan putih [8].
2.5 K – means
Teknik clustering (unsupervised learning) merupakan seni atau teknik mengelompokkan
data (obyek), ke dalam beberapa kluster (kelompok) yang belum diketahui. Penelitian ini
menggunakan dua jenis teknik clustering, diantaranya adalah metode k – means dan fuzzy c-
means. Tujuan dari proses clustering k-means ini adalah untuk meminimalisasikan objective
function yang diset dalam proses clustering. Umumnya nilai objective function berusaha
meminimalkan variasi di dalam suatu kluster dan memaksimalkan variasi antar kluster [9].
Metode k-means akan mencari pusat kluster dan batas – batas kluster melalui proses
perulangan (iterasi). Kedekatan atau kemiripan suatu obyek dengan obyek yang lain atau
dengan pusat kluster dihitung dengan menggunakan fungsi jarak [8]. Fungsi jarak tersebut
dihitung menggunakan persamaan 1.
𝐽𝑗 = ∑ ‖𝑥 − 𝑧𝑗(𝑘 + 1)‖2
, 𝑗 = 1, 2, … , 𝐾𝑥∈𝑆𝑗(𝑘)
Sj(k) menyatakan himpunan sampel, zj(k+1) menyatakan nilai pusat kluster baru dalam
kluster ke – j, sedangkan x menyatakan nilai – nilai pada sampel data. Adapun pusat kluster
baru dihitung menggunakan persamaan 2, dengan 𝑁𝑗 menyatakan jumlah sampel 𝑆𝑗(𝑘)
𝑧𝑗(𝑘 + 1) =1
𝑁𝑗∑ 𝑥
𝑥∈𝑆𝑗(𝑘)
, 𝑗 = 1, 2, … , 𝐾
2.6 Fuzzy C – Means (FCM)
Metode fuzzy c – means memanfaatkan teori fuzzy untuk mengalokasikan data dalam
beberapa kelompok yang sesuai. Logika ini memberikan konsep yang berbeda, yaitu konsep
tingkat kebenaran. Suatu nilai dalam logika fuzzy bisa bernilai benar dan salah secara
bersamaan. Besarnya keberadaan dan kesalahan bergantung pada bobot keanggotaan yang
dimilikinya, yaitu dalam rentang 0 hingga 1 [10].
Fuzzy C-Means memiliki konsep memperbaiki pusat cluster serta derajat keanggotaan
pada tiap – tiap titik secara berulang. Selama proses tersebut pusat cluster akan bergerak
menuju lokasi yang tepat. Perulangan dilakukan berdasarkan pada minimisasi fungsi
obyektif [9]. Nilai fungsi obyektif didapatkan melalui perhitungan dari persamaan 3.
𝐽(𝑈, 𝑉; 𝑋) = ∑ ∑(𝜇𝑖𝑘)𝑤(𝑑𝑖𝑘)2
𝐶
𝑖=1
𝑛
𝑘=1
Dengan 𝑤𝜖[1, ∞],
(1)
(2)
(3)
𝑑𝑖𝑘 = 𝑑(𝑥𝑘 − 𝑣𝑖) = [∑(𝑥𝑘𝑗 − 𝑣𝑖𝑗)
𝑚
𝑗=1
]
1/2
Adapun x adalah data yang dikelompokkan yang berukuran n x m, dengan n = jumlah data
yang akan di cluster; dan m = jumlah variabel, sedangkan v adalah matriks pusat cluster.
2.7 Backpropagation
Backpropagation merupakan salah satu algoritma pembelajaran dalam jaringan saraf
tiruan dan termasuk sistem pembelajaran terawasi (supervised learning). Sistem ini biasanya
menggunakan perceptron dengan banyak lapisan untuk mengubah nilai bobot. Jaringan saraf
tiruan terdiri atas kumpulan node (neuron), dan relasi. Ada tiga tipe lapisan neuron yang
terdapat pada jaringan backpropagation, yaitu lapisan input (x), lapisan tersembunyi (z), dan
lapisan output (y).
Gambar 1. Arsitektur jaringan backpropagation
Algoritma backpropagation menggunakan error output untuk mengubah nilai bobot –
bobotnya dalam arah mundur (backward). Nilai error didapatkan melalui perhitungan pada
tahap perambatan maju (forward propagation).
3. Metode Penelitian
3.1 Data Penelitian
Data citra yang digunakan dalam penelitian merupakan citra digital dari mikroskop
digital dari database yang dibangun oleh Departement of Pathology, Herlev University
Hospital, Denmark. Jumlah citra sel serviks tunggal yang digunakan sebanyak 50 citra sel
normal dan 100 citra sel abnormal untuk pelatihan sistem, serta sebanyak 15 citra sel normal
dan 30 citra sel abnormal untuk pengujian sistem.
1
V12
X1
X2
X3
Z1
Z2
1
y
b11 b12
W1
W2
b2
V11
V21
V22
V31 V32
(4)
3.2 Perancangan Software
Perancangan software secara garis besar terdiri atas beberapa proses pengolahan citra
digital, segmentasi nukleus, ekstraksi fitur bentuk dan statistik, serta klasifikasi data citra
menjadi sel normal dan abnormal.
Gambar 2. Diagram Alir Perancangan Software
Tahapan dalam kotak bergaris putus – putus telah dilakukan pada penelitian sebelumnya
oleh Dewi (2013).
Data citra sel serviks tunggal terlebih dahulu melewati serangkaian proses pengolahan
citra sebelum dilakukan ekstraksi fitur. Penelitian ini mengambil dua nilai fitur, yaitu fitur
bentuk dan fitur histogram dari hasil segmentasi citra nukleus. Nilai – nilai fitur tersebut
yang selanjutnya digunakan sebagai input sistem kecerdasan buatan untuk mengklasifikasi
data menjadi sel normal atau sel abnormal.
3.3 Pengolahan Citra Digital
Citra digital sel serviks tunggal berwarna diubah menjadi citra abu – abu yang memiliki
satu derajat keabuan dengan itensitas 0 – 255. Sebelum disegmentasi, citra digital sel serviks
tunggal diolah menggunakan beberapa jenis teknik olah citra. Pengolahan citra yang
Clustering data citra sel serviks menggunakan
fuzzy c – means dan k - means
Klasifikasi data citra sel serviks menggunakan backpropagation
Data citra terklasifikasi
Data Citra
Sel Serviks Tunggal
Grayscalling
Pengolahan Citra Digital
Ekstraksi Fitur Bentuk
Histogram Citra
Ekstraksi Fitur Histogram
dilakukan antara lain median filtering, contrast stretching, morphologi processing. Teknik
median filtering digunakan untuk menghilangkan noise pada citra grayscale sel serviks.
Selanjutnya citra digital tersebut diperbaiki kontrasnya menggunakan teknik contrast
stretching. Citra hasil contrast stretching kemudian diolah kembali menggunakan
morphological processing, yaitu teknik opening dan closing. Pengolahan ini dilakukan untuk
menghilangkan adanya daerah – daerah kecil berwarna gelap atau terang (small bright or
dark regions) yang dapat mengganggu proses segmentasi.
3.4 Segmentasi Nukleus
Proses segmentasi area nukleus pada citra dilakukan dalam dua tahap yaitu dengan
teknik thresholding dan teknik clearing. Pada teknik thresholding digunakan nilai level
intensitas sebesar 0,2 sebagai nilai ambang, agar area nukleus dapat disegmentasi secara
utuh. Hasil segmentasi kemudian diproses kembali menggunakan teknik clearing. Tahap ini
dilakukan untuk menghilangkan daerah selain area nukleus yang ikut tersegmentasi. Hasil
segmentasi merupakan citra biner nukleus sel serviks.
3.5 Ekstraksi Fitur
Sebanyak 11 jenis fitur digunakan dalam penelitian ini, yang terdiri atas fitur bentuk dan
fitur statistik. Fitur bentuk diekstraksi dari citra hasil segmentasi, sedangkan fitur histogram
diekstraksi dari hasil histogram citra. Berikut ini beberapa fitur yang digunakan:
1. Fitur bentuk [8]
a. Area nukleus: nilai skalar dari jumlah keseluruhan pixel di wilayah nukleus.
b. Perimeter nukleus: nilai skalar dari jumlah keseluruhan pixel pada batas (outline)
dari bentuk nukleus.
c. Faktor bentuk nukleus: nilai skalar yang didefinisikan dalam persamaan 5.
𝑆ℎ𝑎𝑝𝑒𝑁𝑢𝑘𝑙𝑒𝑢𝑠 =𝑃𝑒𝑟𝑖𝑚𝑒𝑡𝑒𝑟𝑁𝑢𝑘𝑙𝑒𝑢𝑠2
𝐴𝑟𝑒𝑎𝑁𝑢𝑘𝑙𝑒𝑢𝑠
d. Faktor kebundaran nukleus: nilai skalar yang didefinisikan dalam persamaan 6.
𝑅𝑜𝑢𝑛𝑑𝑁𝑢𝑘𝑙𝑒𝑢𝑠 = 4 𝑥𝜋𝑥𝐴𝑟𝑒𝑎𝑁𝑢𝑘𝑙𝑒𝑢𝑠
𝑃𝑒𝑟𝑖𝑚𝑒𝑡𝑒𝑟𝑁𝑢𝑘𝑙𝑒𝑢𝑠2
2. Fitur histogram [11]
a. Mean: nilai skalar yang menggambarkan rerata nilai pixel pada masing – masing
intensitas warna citra.
b. Standard deviation: nilai skalar yang menggambarkan penyebaran intensitas pada
citra, serta sebagai indikator kontras pada citra.
(5)
(6)
c. Entropy: nilai skalar yang menggambarkan kehalusan (smoothness) dari citra
dalam hal distribusi derajat keabuannya.
d. Means square: nilai skalar yang didefinisikan dalam persamaan 7.
𝑚2 = ∑ 𝑥2𝑝(𝑥)
𝐿
𝑥=0
e. Variansi: nilai skalar yang didefinisikan dalam persamaan 8.
𝜇2 = ∑(𝑥 − 𝑚1)2𝑝(𝑥)
𝐿
𝑥=0
f. Skewness: nilai skalar yang menunjukkan derajat ketidaksimetrisan kurva
histogram terkait distribusi intensitas dalam suatu citra.
g. Kurtosis: nilai skalar yang menunjukkan tingkat keruncingan relatif kurva
histogram citra terkait distribusi intensitas dalam suatu citra.
3.6 Clustering Data Menggunakan Fuzzy C – Means dan K – Means
Nilai skalar hasil ekstraksi fitur selanjutnya digunakan untuk input sistem clustering
fuzzy c – means dan k – means. Metode ini digunakan untuk mengelompokkan data masukan
sesuai dengan kesamaan ciri. Data input akan dikelompokkan menjadi dua kelompok, yaitu
cluster 1 dan cluster 2.
Proses clustering menggunakan data pelatihan sebanyak 150, yang terdiri atas 100 data
sel abnormal dan 50 data sel normal. Data tersebut diolah terlebih dahulu menggunakan
proses oleh citra, segmentasi nukleus, dan dilanjutkan dengan ekstraksi fitur. Nilai – nilai
fitur tersebut dibagi menjadi 10 komposisi fitur yang berbeda. Masing – masing komposisi
selanjutnya digunakan sebagai input clustering fuzzy c – means dan k – means. Hasil dari
proses clustering ini yaitu salah satu set fitur dengan hasil terbaik. Dipilih juga metode
clustering yang memberikan hasil terbaik diantara keduanya. Hasil tersebut selanjutnya
digunakan sebagai data masukan pada tahap klasifikasi backpropagation.
3.7 Klasifikasi Data Menggunakan Sistem Jaringan Backpropagation
Hasil clustering yang telah diseleksi akan menjadi input untuk sistem jaringan saraf
tiruan. Implementasi dalam klasifikasi data ini terdiri atas dua tahap yaitu pelatihan dan
pengujian. Tahap pelatihan menggunakan data hasil clustering sebanyak 90, yang terdiri atas
16 data pada cluster 1 dan 74 pada cluster 2. Adapun parameter yang digunakan dalam
pelatihan yaitu maksimum iterasi, laju pembelajaran (learning rate), dan jumlah neuron pada
(7)
(8)
hidden layer. Parameter nilai eror yang digunakan sebagai kriteria penghentian iterasi pada
penelitian ini sebesar 10-5. Nilai parameter dan bobot akhir yang menghasilkan akurasi
terbaik digunakan untuk proses pengujian.
Tahap pengujian menggunakan data uji sebanyak 45, yang terdiri atas 30 data sel
abnormal dan 15 data sel abnormal. Dalam proses ini digunakan nilai parameter dan bobot
akhir yang menghasilkan akurasi terbaik dari tahap pelatihan.
4. Hasil Dan Pembahasan
4.1 Segmentasi Nukleus
Gambar 3. Serangkaian proses pengolahan citra hingga segmentasi nukleus (a) citra
RGB (b) citra grayscale (c) citra hasil median filtering (d) citra hasil contrast stretching
(e) citra hasil opening (f) citra hasil closing (g) citra hasil thresholding (h) citra hasil
clearing
(Keterangan: obyek di dalam kotak merah merupakan obyek selain area nukleus yang
dihilangkan)
Keseluruhan data sel serviks tunggal melalui proses segmentasi nukleus dan
beberapa tahapan pengolahan citra. Beberapa tahapan tersebut yaitu grayscalling,
median filtering, contrast stretching, dan metode morphological processing yang terdiri
atas teknik opening dan teknik closing.
Citra sel serviks tunggal selanjutnya disegmentasi area nukleusnya menggunakan
teknik thresholding. Proses segmentasi pada penelitian ini menggunakan nilai level
thresholding pada masing – masing citra sebesar 0,2 (rentang 0 – 1). Nilai ini didapatkan
berdasarkan analisis histogram yang dilakukan pada sampel citra sel serviks. Obyek
selain area nukleus yang terdapat pada citra hasil segmentasi selanjutnya dihilangkan
menggunakan teknik clearing.
(e) (f) (g) (h)
(a) (b) (c) (d)
4.2 Ekstraksi Fitur Citra
Hasil ekstraksi fitur ditampilkan dalam bentuk plot yang disajikan pada gambar 4.
0100020003000400050006000700080009000
0 10 20 30 40 50 60 70 80 90 100110120130 140150
Nila
i Fit
ur
Data Train ke-
Area Nukleus
Abnormal Normal
050
100150200250300350
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Nila
i Fit
ur
Data Train ke-
Perimeter Nukleus
Abnormal Normal
0
5
10
15
20
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Nia
li Fi
tur
Data Train ke-
Faktor Bentuk Nukleus
Abnormal Normal
0
0.5
1
1.5
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150N
ilai F
itu
r
Data Train ke-
Kebundaran Nukleus
Abnormal Normal
0
50
100
150
200
250
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Nila
i Fit
ur
Data Train ke-
Mean
Abnormal Normal
010203040506070
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Nila
i Fit
ur
Data Train ke-
Standard Deviation
Abnormal Normal
4.5
6.0
7.5
9.0
0 50 100 150
Nila
i Fit
ur
Data Train ke-
Entropy
Abnormal Normal
0
20
40
60
80
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Nila
i Fit
ur
Data Train ke-
Standard Deviation
Abnormal Normal
0.00E+005.00E+061.00E+071.50E+072.00E+072.50E+073.00E+07
0 50 100 150
Nila
i Fir
ur
Data Train ke-
Kurtosis
Abnormal Normal
-200000
-100000
0
100000
200000
0 10 20 30 40 50 60 70 80 90 100110120130140150
Nila
i Fit
ur
Data Train ke-
Skewness
Abnormal Normal
4.3 Clustering Data K-means dan Fuzzy c-means (FCM)
Clustering k – means dan fuzzy c – means dilakukan dengan mengelompokkan nilai
dari 10 macam komposisi fitur yang telah dibuat. Data input merupakan data latih, yaitu
sebanyak 100 data sel abnormal dan 50 sel data normal. Komposisi 8 fitur yaitu area,
perimeter, shape factor, roundness, mean, standard deviation, entropy, dan variansi
memberikan hasil perbandingan yang terbaik diantara kesepuluh komposisi fitur.
Clustering metode fuzzy c – means memberikan hasil dengan tingkat kecocokan yang
lebih baik, dimana c1 sebanyak 16 dan c2 sebanyak 74. Metode k – means menghasilkan
perbandingan tingkat kecocokan sebesar 22 untuk c1 dan 41 untuk c2. Data hasil
clustering terbaik selanjutnya digunakan sebagai data masukan pada sistem pelatihan
backpropagation.
4.4 Hasil Pelatihan Backpropagation
Terdapat beberapa parameter yang digunakan dalam proses pelatihan, yaitu
maksimum iterasi, laju pembelajaran (learning rate), dan jumlah neuron pada hidden
layer. Selain itu digunakan kriteria penghentian iterasi yaitu nilai eror sebesar 10-5.
Bobot akhir pelatihan yang menghasilkan akurasi terbaik selanjutnya digunakan untuk
tahap pengujian. Dalam penelitian ini akurasi terbaik dihasilkan dari jumlah neuron
hidden layer sebanyak 10, nilai laju pembelajaran 0,2, dan maksimal epoh 300.
Tabel 1. Nilai akurasi hasil training (kriteria berhenti maksimum epoh)
Max epoh Jumlah Neuron Hidden
Layer
Laju
Pembelajaran Akurasi
100 10 0,2 80%
200 10 0,2 82%
300 10 0,2 100%
4.5 Hasil Pengujian Backpropagation
5000100001500020000250003000035000400004500050000
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Nila
i Fit
ur
Data Train ke-
Means Square
Abnormal Normal
Tahap pengujian dilakukan pada data uji sebanyak 45, yang terdiri atas 30 data sel
abnormal dan 15 data sel normal. Set data selanjutnya diujikan menggunakan nilai bobot
akhir dari proses pelatihan. Akurasi yang dihasilkan dari proses pengujian sebesar 84,44,
dengan jumlah 38 data yang sesuai dan 7 data yang tidak sesuai dengan hasil diagnosis
ahli. Ketidaksesuaian beberapa data dengan target klasifikasi (hasil klasifikasi dari ahli
sitologi atau dokter) ditampilkan pada Gambar 5.
Gambar 5. Grafik perbandingan target dan output pengujian backpropagation
(Keterangan: kotak merah menunjukan ketidaksesuaian antara target dan output )
Gambar 5 memberikan informasi sejumlah 38 data sesuai dengan target, sedangkan 7
data yaitu data ke 9, 10, 11, 12, 13, 14, dan 33 tidak sesuai dengan target hasil diagnosis
ahli. Kesalahan klasifikasi yang terjadi pada kedua data tersebut diduga karena kesalahan
interpretasi data. Citra tersebut masih berada pada awal transformasi dari sel normal
menjadi sel abnormal, sehingga nilai fitur area dan perimeter dari kedua sel berada pada
rentang nilai sel normal. Area sitoplasma pada citra sel serviks memiliki perbedaan yang
signifikan antara sel normal dan sel abnormal. Area sitoplasma didapatkan melalui
teknik segmentasi dengan nilai threshold lebih dari satu, karena area tersebut sulit di-
threshold dari area background. Langkah tersebut dapat dilakukan menggunakan teknik
pengolahan citra lain, seperti deteksi kontur atau adaptive tresholding dengan nilai
threshold lebih dari satu. Teknik ini dapat menghasilkan citra hasil segmentasi akan
mengikuti kondisi citra. Teknik segmentasi lain juga diharapkan dapat mengatasi
masalah pada area nukleus yang tidak tersegmentasi secara utuh, ataupun area bukan
nukleus yang ikut tersegmentasi.
Penyempurnaan program ini dapat dilakukan dengan langkah memilih fitur, dan
menambah data latih. Pemilihan fitur yang dapat mewakili ciri masing – masing data
dapat meningkatkan hasil akurasi. Fitur – fitur tersebut digunakan untuk memaksimalkan
persamaan ciri antara anggota dalam satu kelompok, dan meminimumkan kemiripan
antara satu kelompok dan kelompok yang lainnya.
0
1
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45
Targ
et/
Ou
tpu
t B
ackp
rop
agat
ion
Data ke -
Series1
Series2
5. Kesimpulan
Berdasarkan hasil penelitian ini, dapat disimpulkan bahwa:
1. Fitur citra sel serviks yang digunakan sebagai input identifikasi pada penelitian ini
terdiri atas fitur bentuk dan histogram. Fitur bentuk meliputi area, perimeter
(keliling), faktor bentuk, dan kebundaran, serta fitur statistik histogram meliputi
mean, standard deviation, entropy, dan variansi.
2. Metode backpropagation menghasilkan tingkat kecocokan sebanyak 38 data, dari
data pengujian sebanyak 45.
3. Tingkat akurasi optimal yang dihasilkan melalui proses pengujian sistem jaringan
saraf tiruan backpropagation sebesar 84,44% dengan nilai parameter jumlah neuron
pada hidden layer 10 dan nilai laju pembelajaran 0,2.
4. Hasil penelitian yang didapatkan memiliki nilai akurasi yang lebih rendah
dibandingkan dengan penelitian yang telah dilakukan oleh Dewi pada tahun 2013,
sebesar 93,33%.
Daftar Pustaka
[1] American Cancer Society, 2013, Guide: Cervical Cancer,
http://www.cancer.org/docroot/CRI/content.html,
21 November 2013.
[2] Rosidi, B., Jalil, N., Pista, N.M., Ismail, L.H., Supriyanto, E., Mengko, T.L, 2011,
Classification of Cervical Cells Based on Labeled
Colour Intensitiy Distribution, International Journal
of Biology and Biomedical Engineering.
[3] Suryatenggara, Jeremiah, 2009, Cervix Cancer Detection Based On Pattern Recognition
In Cervical Cytological Slide Images, Fakultas Life
Science, Program Studi Biomedical Engineering,
Swiss Germany University (SGU).
[4] Dewi, E.M, 2013, Ekstraksi Fitur dan Klasifikasi Sel Serviks dengan Metode Learning
Vector Quantization (LVQ) Untuk Deteksi Dini
Kanker Serviks, Program Studi S1 Teknobiomedik,
Fakultas Sains dan Teknologi, Universitas
Airlangga.
[5] Elalfi, Atta., Eisa, Mohamed., Ahmed, Hosnia, 2013, Artificial Neural Networks in
Medical Images for Diagnosis Heart Valve
Diseases, International Journal of Computer
Science Issues, Vol. 10, Issue 5, No 1, Egypt.
[6] FF, Setiawan, 2010, Filter Bandpass dan Bandstop Untuk Menurunkan Noise Pada Citra
Menggunakan Delphi 7.0, Program Studi
Matematika Ekstensi, Jurusan Matematika Fakultas
Matematika dan Ilmu Pengetahuan Alam,
Universitas Diponegoro Semarang.
[7] Solomon, C., Breckon, T, 2011, Fundamental of Digital Image Processing: A Practical
Approach with Examples in Matlab, John Willey &
Sons, Ltd, United Kingdom.
[8] Putra, Darma, 2009, Pengolahan Citra Digital, Penerbit Andi, Yogyakarta.
[9] Luthfi, E.T, 2007, Fuzzy C – Means Untuk Clustering Data (Studi Kasus: Data
Performance Mengajar Dosen), Yogyakarta.
[10] Nasution, Helfi, 2012, Implementasi Logika Fuzzy pada Sistem Kecerdasan Buatan,
Program Studi Teknik Informatika, Jurusan Teknik
Elektro, Fakultas Teknik, Universitas Tanjungpura.
[11] Gonzalez, R.C.,Woods, Richard E, 2002, Digital Image Processing, Pearson Education,
Inc, New Jersey.
Disetujui oleh:
Pembimbing I,
Drs. Adri Supardi, M. Sc
NIP. 195603031986011002
Pembimbing II,
Endah Purwanti, S. Si., M. T
NIP. 1977103120091220003