PERBANDINGAN KLASIFIKASI METODE ANALISIS
DISKRIMINAN VERTEX (VDA)MENGGUNAKAN
PENALTIEUCLIDEAN, PENALTI LASSO DAN PENALTI
RIDGE
(Studi kasus: Data Dermatologi Jenis Penyakit Erythemato-Squamous)
Ayu Puji Rahayu
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2018 M / 1439 H
PERBANDINGAN KLASIFIKASI METODE ANALISIS
DISKRIMINAN VERTEX (VDA)MENGGUNAKAN PENALTI
EUCLIDEAN, PENALTI LASSO DAN PENALTI RIDGE
(Studi kasus: Data Dermatologi Jenis Penyakit Erythemato-Squamous)
SKRIPSI
Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Matematika (S.Mat)
Fakultas Sains dan Teknologi
Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta
Oleh:
Ayu Puji Rahayu
1113094000015
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2018 M / 1439 H
iv
PERSEMBAHAN
Segala puji dan syukur kupanjatkan kepada Allah Subhanahu Wataála.
Sebuah persembahan untuk mereka yang tercinta dan senantiasa
mencinta.Skripsi ini saya persembahkan untuk mama dan bapak atas semua doá
yang tiada henti dipanjatkan, atas semua cinta yangselalu terlimpahkan, dan
atas semua kasih yang selalu tercurahkan.Kelak akan ku tebus tangisanmu
dengan bahagia, keluhanmu dengan kesuksesanku untukmu dimasa tua, dan doá
mu dengan surga, atas kuasa dan ridho Lillahi taála.
Skripsi ini juga kupersembahkan untuk keluarga besar, sahabat,serta dia yang
suatu saat akan mengubah statusku menjadi IRT.
v
MOTTO
“Gantungkanlah cita-citamu setinggi langit, karna ketika jatuh masih berada
diantara gugusan bintang”
“Jadilah yang PERTAMA, jika tidak sempat …
Jadilah yang TERBAIK, Jika masik tidak mampu …
Jadilah yang BERBEDA”
( A.P.R )
“Man Jadda Wajada,Siapa yang bersungguh-sungguh pasti berhasil.
Man Shabara Zhafira,Siapa yang bersabar pasti beruntung.
Man Sara ala Darbiwashala,Siapa yang menapaki jalan-Nya pasti akan sampai
pada tujuan.”
(Pribahasa Arab)
vi
ABSTRAK
Ayu Puji Rahayu,Perbandingan Klasifikasi Metode Analisis Diskriminan
Vertex (VDA) menggunakan Penalti Euclidean, Penalti Lasso dan Penalti
Ridge(Studi kasus: Data Dermatologi Jenis Penyakit Erythemato-
Squamous), di bawah bimbingan Dr. Nina Fitriyati, M.Kom dan Nurmaleni,
M.Si.
Pada penelitian ini akandibandingkan hasil klasifikasi jenis penyakit
erythemato-squamous menggunakan metode Vertex Discriminant Analysis
(VDA) dengan 3 penalti yaitu penaltiEuclidean, penalti lasso dan penalti ridge.
Perbandingan penalti yang digunakan bertujuan untuk menentukan penalti terbaik
pada metode VDA yang menghasilkan kesalahan klasifikasi atau Apparent Rate
Error(APER) terkecil. Data yang digunakan dalam penelitian ini adalah 366 data
pasien jenis penyakit erythemato-squamous dengan 256 data latih dan 110 data
uji. Berdasarkan fungsi diskriminan yang terbentuk, nilai APER pada metode
VDA dengan penalty ridge adalah 0.0175426, dengan penalti lasso sebesar
0.0402698 dan dengan penalti Euclidien sebesar 0.04485085. Berdasarkan nilai
APER, hasil klasifikasi terbaik pada jenis penyakit erythemato-squamous adalah
metode VDA menggunakan penalti ridge.
Kata Kunci: Analisis Diskriminan Verteks (VDA), Penalti Euclidean, Penalti
Lasso, Penalti Ridge, Klasifikasi multikategori, Algorithma MM.
vii
ABSTRACT
Ayu Puji Rahayu, The Comparison between EuclideanPenalty, Lasso Penalty
and Ridge Penaltyon Vertex Discriminant Analysis (VDA) Method (Case
study on the erythemato-squamous disease type data), under the guidance of
Dr. Nina Fitriyati, M.Kom and Nurmaleni, M.Si.
This study will compare the results of classification of erythemato-squamous
disease type using Vertex Discriminant Analysis (VDA) method using 3 penalties
i.e. Euclidean penalty, lasso penalty and ridge penalty. We will use this
comparison to determine the best penalty on the VDA method. These penalties
determined by Apparent Rate Error (APER) value that measure the data
misclassification. We used 366 data of erythemato-squamous patient consist of
256 training data and 110 testing data. Based on the discriminant function, the
APER value on the VDA method using penalty ridge is 0.0175426, a lasso
penalty is 0.0402698 and an Euclidien penalty is 0.04485085. Based on the
smallest APER value, the best classification result in erythemato-squamous
disease type is the VDA method using ridge penalty.
Key words: Vertex Analysis Discriminant (VDA), EuclideanPenalty, Lasso
Penalty, Ridge Penalty, multicategory classification, MMAlgorithm.
viii
KATA PENGANTAR
Assalamu’alaikum Warahmatullahi Wabarakatuh
Alhamdulillah, Segala puji serta syukur kehadirat Allah SWT, yang telah
melimpahkan rahmat, ridha dan karunia-Nya sehingga pada akhirnya penulis
dapat menyelesaikan skripsi dengan judul “Analisis Diskriminan Vertex Berbasis
Reproducing Kernel Hilbert Space Untuk Klasifikasi Penyakit Erythemato-
squamous”.Shalawat serta salam senantiasa tercurah kepada Nabi Muhammad
Salallahu alaihi wasalam, para sahabat, keluarga, serta muslimin dan muslimat.
Semoga kita mendapat syafa’at oleh Nabi Muhammad Salallahu alaihi wasalamdi
akhirat kelak. Aamiin.
Dalam menyelesaikan skripsi ini, penulis mendapat banyak
bimbingan,saran, kerjasama dan bantuan dari berbagai pihak.Untuk itu, pada
kesempatan ini penulis ingin menyampaikan terima kasih kepada :
1. Bapak Dr. Agus Salim, M.Si, selaku Dekan Fakultas Sains dan Teknologi
Universitas Islam Negri Syarif Hidayatullah Jakarta.
2. Ibu Dr. Nina Fitriyati, M. Kom selaku Ketua Program Studi Matematika
Fakultas Sains dan Teknologi Universitas Islam Negri Syarif Hidayatullah
Jakarta serta dosen pembimbing I yang telah memberikan ilmu
pengetahuan, pengarahan, bimbingan, dan membantu penulis dalam
menyelesaikan skripsi ini
3. Ibu Irma Fauziah, M.Sc, selaku Sekretaris Program Studi Matematika
Fakultas Sains dan Teknologi UIN Syarif Hidayatullah.
4. Ibu Nurmaleni, M. Si selaku Dosen Pembimbing II yang telah
memberikan ilmu pengetahuan, pengarahan, bimbingan, dan membantu
penulis dalam menyelesaikan skripsi ini, serta telah memberikan inspirasi
untuk metode skripsi yang digunakan.
ix
5. Bapak Taufik Edy Sutanto, Ph.D, selaku Dosen Penguji I dan Dosen
Program Studi Matematika yang telah memberikan ilmu, saran, dan
masukan pada penulis.
6. Bapak Mahmudi, M.Si, selaku Dosen Penguji II dan Dosen Program Studi
Matematika yang telah memberikan ilmu, saran, dan masukan pada
penulis.
7. Seluruh Bapak dan Ibu Dosen program studi Matematika Fakultas Sains
dan Teknologi UIN Syarif Hidayatullah Jakarta atas semua ilmu dan
pengetahuan yang telah diberikan.
8. Mama Nengsih dan Bapak Rusmanto sebagai orang tua penulisyang selalu
memberikan do’a, nasihat, kasih sayang, semangat, pengorbanan,
dukungan moril maupun materil, serta semua yang telah diberikan kepada
penulis.
9. Adela, Awan, Indah, Ryan, Mala, Hendra selaku adik dan kakak penulis,
serta Ibrahim umar adhyasta ponakan penulis karena telah menjadi
penyemangat dan penghibur saat menghadapi kesulitan menyelesaikan
skripsi, serta seluruh keluarga besar yang tidak dapat disebutkan satu
persatu.
10. Haryadi yang telah meminjamkan laptopnya kepada penulis dalam
menyelesaikan skripsi ini, serta terimakasih telah memberikan semangat
lulus dan karena akan menjadikan harapan yang disemogakan menjadi
tersemogakan setelahnya.
11. (Nine dara) Cynthia, Nadya, Sarah sebagai teman kostan selama kurang
lebih 3 tahun telah menemani dalam belajar, menghibur, bahkan menjadi
pengganti keluarga selama dikostan, juga untuk Imas, Sofi, Otmilda,
Dayinta, Alfi.
12. Khoeria sebagai partner penulis dalam bidang kebendahara, konsumsi,
bimbingan, sampai penyelesaian skripsi. Lisna sebagaiteman yang
memberikan tumpangan nginep dikostannya untuk menyelesaikan skripsi.
Ka Eka, Ka Delima, Ka Dewi dan seluruh keluarga besar Himatika UIN
Jakarta dan komunitas UIN Preneurs.
x
13. Seluruh keluarga besar Cypress family (Math’13) Bagus, Yuniar, Ainul,
Ilva, Rafika, putri, Mulyanah, Elly, Nunis, Irfi, Nda, Ndi, Angga, Panjul,
Aul, Faiz, Andika, Adi, Asfar, Emin, Uta terimakasih karna telah
menemani selama 4 tahun ini dan akan selalu menemani pada tahun-tahun
berikutnya.
14. Damays (Dhiah, Amra, Mia, Yusni, Suci), Caprio (Henny, Della, Zahrotin,
Ribka, Atikah, Nikita, Mega, Stifanny, Sinta, Firdy ), Keluarga besar
9153, Kkn Swing,Septi ratna, Emah, Najib, Harun, Nur Fitri, Shinta,
seluruh teman dan sahabat yang selalu menjaga hubungan baik ini sampai
saat ini.
15. Seluruh pihak yang telah membantu penulis dalam mengerjakan skripsi ini
maupun yang telah memeberi semangat dan kebahagiaan dalam kehidupan
penulis yang tidak dapat disebutkan satu persatu.
Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat, baik
sebagai bahan karya tulis berupa informasi, perbandingan maupun dasar
penelitian lebih lanjut. Penulis mohon maaf atas segala kesalahan dan kekurangan
dalam penyelesaian skripsi ini. Penulis mengharapkan kritik dan saran yang
bersifat membangun untuk perbaikan dimasa yang akan datang melalui email
Wassalamu’alaikum Warahmatullahi WabarakatuhJakarta, M
Jakarta, 10 Januari 2018
Penulis
Ayu Puji Rahayu
1113094000015
xi
DAFTAR ISI
LEMBAR PENGESAHAN ................................................................................................ ii
PERNYATAAN ................................................................................................................ iii
PERSEMBAHAN ...............................................................................................................iv
MOTTO .............................................................................................................................. v
ABSTRAK ..........................................................................................................................vi
ABSTRACT ....................................................................................................................... vii
KATA PENGANTAR ...................................................................................................... viii
DAFTAR ISI ....................................................................................................................... xi
DAFTAR TABEL ............................................................................................................. xiii
BAB I PENDAHULUAN ................................................................................................... 1
1.1 Latar Belakang ..................................................................................................... 1
1.2 Perumusan Masalah.............................................................................................. 3
1.3 Batasan Masalah ................................................................................................... 3
1.4 Tujuan Penelitian.................................................................................................. 4
1.5 Manfaat Penelitian................................................................................................ 4
BAB II TINJAUAN PUSTAKA ........................................................................................ 5
2.1 Vertex Discriminant Analysis (VDA) .................................................................. 5
2.2 Simpul pada Ruang ℝ𝑘 − 1 ........................................................................ 5
2.3 Fungsi Kerugian (Loss Function) ............................................................... 7
2.4 Fungsi Tujuan pada VDA ........................................................................... 7
2.5 Algoritma Majorize Minimize (MM) ................................................................. 10
2.5.1 Mayorisasi Fungsi Kerugian dan Fungsi Tujuan ...................................... 11
2.6 Apparent Eror Rate (APER) ............................................................................... 12
BAB III METODOLOGI PENELITIAN ......................................................................... 14
3.1 Sumber Data ....................................................................................................... 14
3.2 Data Peubah ....................................................................................................... 14
3.3 Metode Analisis.................................................................................................. 16
3.4 Alur Penelitian ................................................................................................... 19
BAB IV HASIL DAN PEMBAHASAN .......................................................................... 20
xii
4.1 Deskripsi Data .................................................................................................... 20
4.4 Pembentukan Model VDA dengan Penalti Lasso .............................................. 23
4.5 Pembentukan Model VDA dengan Penalti Ridge .............................................. 27
BAB V KESIMPULAN DAN SARAN ............................................................................ 30
5.1 Kesimpulan ........................................................................................................ 30
5.2 Saran ................................................................................................................... 30
REFERENSI ..................................................................................................................... 32
xiii
DAFTAR TABEL
Tabel 2. 1 Simpul berjarak sama di ℝ𝑘 − 1 ........................................................... 6
Tabel 2. 2 Kesalahan klasifikasi (Nilai APER) .................................................... 12
Tabel 3. 1 Distribusi Kelas Jenis Penyakit Erythemato-Squamous ..................... 14
Tabel 3. 2 Daftar Peubah Berdasarkan Pemeriksaan Klinis ................................. 15
Tabel 3. 3 Daftar Peubah Hasil Pemeriksaan Histopatologis ............................... 15
Tabel 4. 1 Simpul berjarak sama di ℝ𝑘 − 1 untuk 6 kelompok ........................... 20
Tabel 4. 2 Ketepatan Model VDA dengan Penalti Euclidean pada Data Latih ... 21
Tabel 4. 3 Jarak Antar Objek dengan Simpul menggunakan Metode VDA dengan
Penalti Euclidean pada Data Pasien 1 ................................................................... 22
Tabel 4. 4 Ketepatan Model VDA dengan Penalti Euclidean pada Data Uji ....... 23
Tabel 4. 5 Ketepatan Model VDA dengan Penalti Lasso pada Data Latih .......... 24
Tabel 4. 6 Jarak Antar Objek dengan Simpul menggunakan Metode VDA dengan
Penalti Lasso pada Data Pasien 1 .......................................................................... 25
Tabel 4. 7. Hasil Klasifikasi Metode VDA dengan Penalti Lasso pada Data Uji 26
Tabel 4. 8 Ketepatan Model VDA dengan Penalti Ridge pada Data Latih .......... 27
Tabel 4. 9 Jarak Antar Objek dengan Simpul menggunakan Metode VDA dengan
Penalti Ridge pada Data Pasien 1.......................................................................... 28
Tabel 4. 10 Ketepatan Model VDA dengan Penalti Ridge pada Data Uji ........... 29
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
“Setiap penyakit pasti memiliki obat. Bila sebuah obat sesuai dengan penyakitnya
maka dia akan sembuh dengan seizinAllah Subhanahu wa Taála.” (HR. Muslim)
Berdasarkan hadist di atas semua penyakit yang menimpa makhluk hidup
maka Allah Subhanahu wa Taála juga akan menurunkan obatnya, dan apabila
obat tersebut sesuai dengan penyakit yang diderita maka dia akan sembuh atas
izin Allah Subhanahu wa Taála. Oleh karena itu dibutuhkan diagnosa yang tepat
terhadap suatu penyakit dan dibutuhkan penanganan yang tepat pula untuk
mengobati penyakit tersebut. Menghindari tubuh dari berbagai penyakit dengan
menjaga kesehatan adalah hal penting bagi setiap individu, salah satunya adalah
penyakit kulit. Kulit adalah bagian terluar pada tubuh manusia yang rentan
terhadap penyakit. Penyakit kulit dapat diakibatkan oleh kurangnya menjaga
kebersihan, perubahan cuaca, gigitan serangga, virus, bakteri, alergi maupun
faktor penyebab lain.Dermatologi adalah cabang ilmu kesehatan dan kedokteran
yang berhubungan dengan kulit dan bagian-bagian yang berhubungan dengan
kulit seperti rambut, kulit kepala, kuku, kelenjar keringat, dan bagian lain yang
serupa. Berbagai macam penyakit kulit yang ada saat ini dari yang ringan hingga
masalah kronis, oleh karena itu dibutuhkan penanganan yang tepat dalam
mencegah maupun mengobati penyakit kulit yang memiliki karakteristik yang
berbeda-beda tersebut.
Erythemato-squamous adalah salah satu kelompok jenis penyakit kulit,
penyakit kulit yang tergabung dalam kelompok ini adalah psoriasis, seboreic
dermatitis, lichen planus, pityriasis rosea, cronic dermatitis dan pityriasis rubra
pilaris. Penelitian untuk mendiagnosa jenis penyakit erythemato-squamousperlu
dilakukanuntuk mendiagnosa dengan tepat dan akurat jenis penyakit erythemato-
2
squamous yang memiliki ciri-ciri klinis erythema dan scaling dengan perbedaan
yang sangat kecil pada gejala awal pasien [8]. Oleh karena itu diperlukan sebuah
sistem yang menerapkan informasi dan keahlian dari pakar medis dapat dibentuk
untuk mendiagnosa jenis penyakit erythemato-squamoussecaraefektif dan akurat.
Pada penelitian ini akan dilakukan pengklasifikasian penyakit erythemato-
squamous menggunakan analisis diskriminan.Analisis diskriminan merupakan
salah satu metode statistik untuk memisahkan sekumpulan objek atau observasi
dengan mengalokasikan objek baru ke dalam kelompok yang telah didefinisikan
sebelumnya. Pengklasifikasikan objek kedalam suatu kelompok dilakukan
berdasarkan sejumlah peubah penjelas yang ada[2].Tingginya tingkat kebutuhan
menggunakan analisis diskriminan membuat bidang ini sangat diperhatikan untuk
dikembangkan salah satunya adalah vertex discriminant analysis (VDA) [6].
Metode VDApertama kali dikembangkan oleh Lang dan Wu [6] pada kasus
multikategori linier, metode ini dapat digunakan bahkan pada masalah dimensi
tinggi (high dimensional) yaitu ketika banyaknya peubah (p) jauh lebih besar dari
banyaknya objek (n), pada kondisi 𝑝 ≫ 𝑛 ini akan menghasilkan matriks
variance covariance yang dihasilkan adalah non-trivial (tidak memiliki solusi
tunggal) sehingga fungsi diskriminan tidak dapat dibentuk[6].Metode VDA
menggunakan simpul (vertex) berjarak sama di ruangEuclidean(ℝk−1 ) yang
digunakan untuk pengkodean indikator kelas dimana masing-masing simpul
menunjukan kelompok yang berbeda [12]. Metode VDA untuk kasus
multikategori linier menghasilkan ketepatan klasifikasi yang lebih baik
dibandingkan metode klasifikasi lainnya [10][3]. Klasifikasi untuk membentuk
fungsi diskriminan pada metode VDA dilakukan dengan meminimalkan fungsi
tujuan menggunakan Algoritma Majorize-Minimize untuk mendekatkan fungsi
kerugian dengan fungsi kuadrat menggunakan reweighted least square [5].Fungsi
tujuan terdiri dari fungsi kerugian ε-insensitifdan penambahan penalti.
Penambahan penalti digunakan pada saat seleksi peubah dengan cara
memperkecil koefisien parameter yang berkorelasi mendekati nilai nol. Sehingga
penambahan penalti dapat meregularisasi pendugaan koefisien regresi dengan
mendekati nilai dugaan menuju nilai sebenarnya menggunakan validasi silang (cross-
3
validation)[6]. Penambahan penaltiyang digunakan pada penelitian ini adalah
penaltiEuclidean, penalti lasso danpenalti ridge dimana masing-masing penalti
memiliki karakteristik dan fungsi penalti yang berbeda.Pada penelitian ini akan
dilakukan perbandingan hasil klasifikasi jenis penyakit erythemato-squamous
berdasarkan kesalahan klasifikasi atau Apparent Rate Error(APER) terkecil
menggunakan metode VDA dengan 3 penalti yaitu penaltiEuclidean, penalti lasso
danpenalti ridge.Selain itu, akan ditentukan pula peubah penjelas yang
berpengaruh terhadap jenis penyakit erythemato-squamous.
1.2 Perumusan Masalah
1. Bagaimana melakukan proses pembentukan fungsi diskriminan jenis
penyakit erythemato-squamousmenggunakan metode VDAdengan
penaltiEuclidean, penalti lasso dan penalti ridge?
2. Bagaimana mengklasifikasikan penyakit erythemato-squamous pada pasien
dengan ciri-ciri klinis dan histopatologis berdasarkan fungsi VDA dengan
penaltiEuclidean, penalti lasso dan penalti ridge?
3. Bagaimana menentukan peubah penjelas yang berpengaruh terhadap jenis
penyakit erythemato-squamousmenggunakan metode VDA dengan
penaltiEuclidean, penalti lasso dan penalti ridge?
4. Bagaimana menghitung kesalahan klasifikasi berdasarkan nilai APER pada
metode VDA dengan penaltiEuclidean, penalti lasso dan penalti ridge?
5. Bagaimana perbandingan hasil klasifikasi metode VDA
denganpenaltiEuclidean, penalti lasso dan penalti ridge?
1.3 Batasan Masalah
Penelitian ini menggunakan data dermatologi pada jenis penyakit
erythemato-squamousyang terdiri dari 6 kelompok penyakit dengan 34 peubah
berdasarkan ciri-ciri klinis dan histopatologis [8]. Metode pengklasifikasian objek
yang digunakan pada penelitian ini adalah metode VDA dengan penaltiEuclidean,
penalti lasso dan penalti ridge. Pada penelitian ini akan dilakukan perbandingan
4
hasil klasifikasi menggunakan metode VDA dengan 3 penalti berbeda yaitu
menggunakan penaltiEuclidean, penalti lasso dan penalti ridge.
1.4 Tujuan Penelitian
1. Melakukan proses pembentukan fungsi diskriminan dengan metode VDA
dengan penaltiEuclidean, penalti lasso dan penalti ridge.
2. Mengklasifikasikan penyakit erythemato-squamous pada pasien dengan ciri-
ciri klinis dan histopatologis berdasarkan fungsi VDA dengan
penaltiEuclidean, penalti lasso dan penalti ridge.
3. Menentukan peubah penjelas yang berpengaruh terhadap jenis penyakit
erythemato-squamous metode VDA dengan penaltiEuclidean, penalti lasso
dan penalti ridge.
4. Menghitung kesalahan klasifikasi berdasarkan nilai APER pada metode
VDA dengan penaltiEuclidean, penalti lasso dan penalti ridge.
5. Membandingkan hasil klasifikasi metode VDA dengan penaltiEuclidean,
penalti lasso dan penalti ridge
1.5 Manfaat Penelitian
Manfaat yang diperoleh dari penelitian ini adalah membentuk suatu sistem
berupa fungsi yang dihasilkan oleh metode VDA untuk mendiagnosa jenis
penyakit erythemato-squamous pada pasien. Selain itu metode VDA juga dapat
menentukan peubah penjelas yang berpengaruh terhadap jenis penyakit
erythemato-squamous. Manfaat dari perbandingan metode VDA dengan 3 penalti
berbeda yaitu penaltiEuclidean, penalti lasso dan penalti ridge pada penelitian ini
adalah mengetahui penalti terbaik yang dapat digunakan untuk klasifikasi pada
metode VDA.
5
BAB II
TINJAUAN PUSTAKA
2.1 Vertex Discriminant Analysis (VDA)
VDA adalah salah satu metode statistik multivariat untuk
mengklasifikasikan objek dengan mengembangkanmetode analisis diskriminan
menggunakan simpul (vertex) dari simpleks pada ruang Euclidean[5]. VDA dapat
digunakan bahkan pada kasus data berdimensi tinggi (high dimensional data)yaitu
ketika banyaknya peubah (p) jauh lebih besar dari banyaknya objek (n) [6].
Masalah yang akan terjadi akibat dimensi tinggi adalah overfitting, hal ini dapat
ditangani dengan regularisasi yaitu mengatur estimasi koefisien regresi dengan
menambahkan aturan penalti yang dapat mengecilkan nilai estimasi menuju nilai
sebenarnya. Regularisasi yang dilakukan menggunakan kalibrasi dengan cross
validation. Klasifikasi untuk membentuk fungsi diskriminan seperti dalam regresi
multivariat yang dilakukan dengan minimisasi fungsi tujuanyang melibatkan
fungsi kerugian ε-insensitif dan penambahan penaltipada peubah prediktor [5].
2.2 Simpul pada Ruang ℝ𝒌−𝟏
Simpul (vertex) adalah suatu titik berjarak sama pada ruang simpleks yang
digunakan untuk pengkodean indikator kelas dari masing-masing kelompok
dimana masing-masing simpul menunjukan kelompok yang berbeda. Agar setiap
simpul memiliki jarak yang sama, VDA menggunakan simpul berjarak sama di
ruang Euclideanℝ𝑘−1untuk pengkodean indikator kelas yang berbeda pada setiap
kelompok, dimana k adalah banyaknya kelompok. Simpul berjarak sama di ℝ𝑘−1
oleh Lange dan Wu didefinisikan sebagai berikut[12]:
𝑣𝑗 = 𝑘 − 1 −1
2𝟏 𝑖𝑓 𝑗 = 1,𝑐𝟏 + 𝑑𝒆𝑗−1 𝑖𝑓 2 ≤ 𝑗 ≤ 𝑘,
(2. 1)
dengan :
1 = matriks berukuran 1 𝑥 𝑛𝑗 ,
6
𝒆𝑗= vektor koordinat ke-j dalam ℝ𝑘−1 (bernilai 1 pada saat ke-j dan 0 untuk
lainnya),
𝑐 = −1+ 𝑘
𝑘−1 32
dan 𝑑 = 𝑘
𝑘−1.
Dengan menggunakan Y dan X untuk masing-masing menunjukkan
indikator kelompok (peubah respon) dan peubah penjelas dari masing-masing
objek. Vektor Y sama dengan salah satu simpul dari simpleks tergantung
kelompok mana yang menjadi miliknya, yaitu 𝑌𝑖 = 𝒗𝑗 [12]. Sebagai contohyang
didapatkan dengan perhitungan pada persamaan (2.1)diberikan tabel 2.1 yang
menunjukan nilai vektorsimpul berjarak sama di ℝk−1 untuk 2 kelompokyaitu
vektor 𝒗𝟏dan 𝒗𝟐sedangkan untuk 3 kelompok yaitu vektor 𝒗𝟏,𝒗𝟐dan 𝒗𝟑sebagai
berikut:
Tabel 2. 1 Simpul Berjarak Sama di ℝ𝑘−1
Banyak kalompok (k) 𝒗𝒋
2 𝒗𝟏 = 1.000
𝒗𝟐 = −1.000
3 𝒗𝟏 = 0.7070.707
𝒗𝟐 = 0.258−0.965
𝒗𝟑 = −0.9650.258
Pada saat banyaknya kelompok 3 maka simpul berada padaℝ2dengan
koordinat simpul pada v1 = [0.707 0.707]v2 = [0.258 − 0.965] dan v3 =
[−0.965 0.258]. Sebagai ilustrasi diberikan gambar yang menunjukan ilustrasi
simpul untuk tiga kelompok pada ℝ2 yang disajikan pada gambar 2.1 sebagai
berikut:
7
Gambar 2. 1: Ilustrasi Simpul untuk Tiga Kelas
2.3 Fungsi Kerugian (Loss Function)
Fungsi kerugian (loss function) dinotasikan L(y,x). Pada metodeFungsi
kerugian yang digunakan adalah fungsi kerugian ε-
insensitive𝑛−1 𝐿(𝑦𝑖 , 𝑥𝑖)𝑛𝑖=1 .Pada VDA, kita menerapkan fungsi kerugian untuk
kasus ini menjadi 𝑔 𝒛 = 𝑔( 𝑦𝑖 − 𝐹 (𝑥𝑖)), sedangkan jarakEuclideanε-insensitif
didefinisikan sebagai berikut[6]:
𝑔 𝒛 = 𝒛 2.𝜀 = max 𝒛 2 − 𝜀, 0 ,(2. 2)
Dengan,
𝜀 =1
2
2𝑘+1
𝑘,
𝒛 2 adalah normEuclideandari vektor.
2.4 Fungsi Tujuan pada VDA
Fungsi tujuan merupakan nilai ekspektasi dari fungsi kerugian (loss
function).Analisis diskriminan berusaha untuk meminimumkan nilai ekspektasi
kerugian 𝐸 𝐿 𝑌,𝑋 = 𝐸 𝐸 𝐿 𝑌,𝑋 𝑋 agar nilai ekspektasi kerugian
mendekati nilai populasi. Hal ini sulit dilakukan karena fungsi kerugian ε-
insensitif yang non-trivial tidak dapat diturunkan sehingga pendugaan parameter
pada VDA untuk proses klasifikasi dilakukan dengan cara
8
meminimumkan𝑛−1 𝐿(𝑦𝑖 ,𝑓𝑖)𝑛𝑖=1 ditambah aturan penalti untuk meregularisasi
estimasi. Aturan penaltibergantung pada konstanta pemulus 𝜆 dan mengabaikan
intersep konstanta b[5].
2.4.1 PenaltiEuclidean pada Vertex Discriminant Analysis ( VDAE)
Penalti Euclidean didefinisikan sebagai 𝑃 𝐴 = 𝑎𝑗 2
𝑘𝑗=1 . Pada tahap
pembentukan fungsi diskriminan penambahan penalti disarankan untuk
menggunakan semua parameter dalam kelompok maupun menyeleksi parameter
dalam kelompok. Dalam klasifikasi multikategori, parameter slope untuk dimensi
𝑅𝑘−1 membentuk kelompok sebenarnya. NormEuclidean𝜆𝐸 𝑎𝑙 2adalah penalti
ang ideal karena mempertahankan konveksitas [6]. PenaltiEuclideanmemiliki
beberapa sifat antara lain metode VDA dengan penaltiEuclideanini efektif karena
fitur dari penalti melakukan seleksi parameter untuk pemilihan model.Selain itu
penaltiEuclideansecara terus menerus dapat diturunkan meskipun 𝑎𝑙 non trivial
[6].Setelah dilakukan identifikasi terhadap kelas indikator dengan simpul,
fungsi tujuan terdiri dari fungsi kerugian dan penalti Euclidean, didefinisikan
sebagai berikut [6]:
𝑅 𝜃 =1
𝑛 𝑔(
𝑛
𝑖=1
𝒚𝑖 − 𝑨𝑥𝑖 − 𝒃) + 𝜆𝐸 𝑎𝑗 2
𝑘
𝑗=1
.
2.4.2 Penalti Lasso pada Vertex Discriminant Analysis ( VDAL)
Penalti lasso didefinisikan sebagai 𝑃 𝐴 = 𝑎𝑗𝑙 𝑝𝑙=1
𝑘−1𝑗=1 . Penalti Lasso
memiliki beberapa sifat antara lain metode VDA dengan penalti lasso ini efektif
karena fitur dari penalti melakukan seleksi parameter untuk pemilihan
model.Setelah dilakukan identifikasi terhadap kelas indikator dengan simpul,
fungsi tujuan terdiri dari fungsi kerugian dan penalti lasso, didefinisikan sebagai
berikut [6]
𝑅 𝜃 =1
𝑛 𝑔(
𝑛
𝑖=1
𝒚𝑖 − 𝑨𝑥𝑖 − 𝒃) + 𝜆𝐸 𝑎𝑗 2
𝑘
𝑗=1
.
9
2.4.3 Penalti Ridge pada Vertex Discriminant Analysis ( VDAR )
Penalti ridge didefinisikan sebagai 𝑃 𝐴 = 𝑎𝑗 2
𝑘𝑗=1 VDA linier
mengasumsikan model regresi linier𝑓 𝑥 = 𝐴𝑥 + 𝑏, dimana𝐴 = (𝑎𝑗𝑚 ) adalah
matriks berukuran 𝑘 − 1 𝑥 𝑝dari slope dan 𝑏 = (𝑏𝑗 ) adalah vektor
berukuran(𝑘 − 1) dari kolom intersep. Untuk menghindari overfitting, dilakukan
penerapan penalti pada parameter slope 𝑎𝑗𝑚 . Penambahan penalti ridge digunakan
pada saat seleksi peubah dengan cara memperkecil koefisien parameter yang
berkorelasi mendekati nilai nol untuk peubah-peubah yang berkorelasi [12].
Setelah dilakukan identifikasi terhadap kelas indikator dengan simpul,
fungsi tujuan terdiri dari fungsi kerugian dan penalti ridge, didefinisikan sebagai
berikut[12]:
𝑅 𝜃 =1
𝑛 𝑔(𝑛𝑖=1 𝒚𝑖 − 𝑨𝑥𝑖 − 𝒃) + 𝜆 𝑎𝑗𝑙
2𝑝𝑙=1 ,𝑘−1
𝑗=1 (2. 3)
Dengan :
𝑛 = 𝑛1 + 𝑛2 + 𝑛3 + ⋯+ 𝑛𝑗 ,
θ = (A, b) menunjukkan himpunan semua parameter yang tidak diketahui,
λ ≥ 0 adalah parameter pemulus.
Penalti ridge didefinisikan sebagai𝑎𝑗 adalah baris ke-j dari matriks
𝐴(𝑘−1)𝑥𝑝 [4]. Pada fungsi kerugian (2. 3) nilai estimasi 𝐴 dan estimasi
𝑏 convex(tidak memiliki solusi unik), oleh karena itu solusi unik dapat diestimasi
dengan titik yang minimum. Ketika λ> 0, nilai minimum tunggal untuk fungsi
tujuan R (θ) dijamin karena konveksitasnya yang ketat. Nilai estimasi 𝐴 dan
estimasi 𝐵 diperoleh, setelah itu dapat menetapkan kasus baru ke simpul terdekat,
dan dapat diprediksi oleh Ŷ = argmin 𝑗 = 1,2,...,𝑘 𝒗𝑗 − Â𝑥 − 𝒃 2untuk
mendapatkan kelompok kategori yang sesuai [12].
Prediksi dengan metode VDARMemliki keunggulan dalam perhitungan
statistika dan keunggulan dalam kecepatan perhitungan komputasi menggunakan
10
algoritma terbaik untuk analisis diskriminan, akan tetapi VDAR memiliki
keterbatasan. Meskipun VDARmengecilkan parameter menuju 0 untuk parameter
tertentu, VDAR tidak dapat melakukan seleksi parameter pada model VDARyang
dibentuk kecuali jika peneliti memiliki aturan sendiri untuk menghilangkan
parameter dengan batas besaran parameter yang ditentukan sendiri [6].
2.5 Algoritma Majorize Minimize (MM)
Algoritma MM dapat digunakan untuk meminimisasi fungsi kerugian
dengan cara optimasi iterasi [5]. Minimalisasi Persamaan (2.4) dapat
diimplementasikan dengan menggabungkan algoritma MM dan estimasi ridge
terkecil Algoritma MM. Mayorisasi pada M pertama dilakukan dengan cara
memperoleh fungsi pengganti 𝑔(𝜃|𝜃𝑚) untuk fungsi tujuan 𝑓(𝜃) pada titik
tertentu di iterasi 𝜃𝑚 . Fungsi ini dikatakan mayorisasi fungsi 𝑓(𝜃) pada 𝜃𝑚
apabila
𝑓 𝜃𝑚 = 𝑔 𝜃 𝜃𝑚 ,
𝑓 𝜃 ≤ 𝑔 𝜃 𝜃𝑚 , 𝑢𝑛𝑡𝑢𝑘 𝜃 ≠ 𝜃𝑚 ,
Untuk masalah minimisasi, M kedua berarti 'minimisasi 'Ketika fungsi
pengganti dioptimalkan, fungsi tujuan akan didorong agar meningkat atau
menurun sesuai kebutuhan. Pada VDA algoritma MM dibutuhkan untuk
meminimumkan fungsi pengganti 𝑔(𝜃|𝜃𝑚 ) daripada 𝑓 𝜃 . Jika 𝜃𝑚+1 dinotasikan
yang meminimumkan 𝑔(𝜃|𝜃𝑚 ) sehingga𝑓 𝜃𝑚+1 ≤ 𝑓 𝜃𝑚 , fungsi ini diperoleh
dari
𝑓 𝜃𝑚+1 = 𝑔 𝜃𝑚+1 𝜃𝑚 + 𝑓 𝜃𝑚+1 − 𝑔 𝜃𝑚+1 𝜃𝑚 ,
≤ 𝑔 𝜃𝑚 𝜃𝑚 + 𝑓 𝜃𝑚 − 𝑔 𝜃𝑚 𝜃𝑚 = 𝑓 𝜃𝑚 ,
Mengakibatkan 𝜃𝑚+1 𝜃𝑚 ≤ 𝑔 𝜃𝑚 𝜃𝑚 . Penurunan dari hasil algoritma MM ini
akan menghasilkan nilai yang stabil. Untuk tujuan komputasi fungsi ridge adalah
yang idel untuk digunakan. Algoritma MM bertujuan untuk mencapai konvergen
minimum global untuk fungsi tujuan yang non-trivial sehingga dapat
menghasilkan solusi unik[6].
11
2.5.1 Mayorisasi Fungsi Kerugian dan Fungsi Tujuan
Mayorisasi fungsi kerugian 𝑓 𝑥 = 𝑥 𝜀yang dihasilkan dari persamaan
Cauchy-Schwarz adalah sebagai berikut [5]:
𝑔 𝑥|𝑥𝑚 =
1
2 𝑥𝑚 𝑥2 +
1
2 𝑥𝑚 − 𝜀 𝑢𝑛𝑡𝑢𝑘 𝑥𝑚 ≥ 2𝜀 ,
1
4(𝜀− 𝑥𝑚 ) 𝑥 − 𝑥𝑚 2 𝑢𝑛𝑡𝑢𝑘 𝑥𝑚 < 𝜀,
1
4(𝜀− 𝑧 ) 𝑥 − 𝑧 2 𝑢𝑛𝑡𝑢𝑘 𝜀 < 𝑥𝑚 < 2𝜀,
(2. 4)
Dengan 𝑧 = 𝑐𝑥𝑚 dan 𝑐 =2𝜀
𝑥𝑚 − 1.
Fungsi kerugian ε-insensitive (2.2) dapat digunakan pada semua simpul
kecuali dua kinks pada ± ε, Mayorisasi fungsi kerugian ε-insensitive oleh Lange
dan Wu sebagai berikut [5]:
𝑔 𝜃 =1
𝑛 𝑔(𝑦𝑖 − 𝑓(𝑥𝑖)),
𝑛
𝑖=1
≤1
𝑛 𝑤𝑖 𝑟𝑖 − 𝑠𝑖 2
2 + 𝜆 𝑎𝑗 2
+ 𝑓,
𝑘−1
𝑗=1
𝑛
𝑖=1
1
𝑛 𝑤𝑖 𝑟𝑖𝑗 − 𝑠𝑖𝑗
2𝑛𝑖=1 + 𝜆 𝑎𝑗
2
+ 𝑓,𝑘−1𝑗=1 (2. 5)
Dengan residual𝑟𝑖 = 𝑦𝑖 − 𝑓 𝑥𝑖 dan bobot
𝑤𝑖 =
1
2 𝑟𝑖(𝑚)
𝑗𝑖𝑘𝑎 𝑟𝑖
(𝑚) ≥ 2𝜀,
1
4(𝜀 − 𝑟𝑖 𝑚 )
𝑗𝑖𝑘𝑎 𝑟𝑖(𝑚)
< 𝜀,
1
4( 𝑟𝑖 𝑚 − 𝜀)
𝑗𝑖𝑘𝑎 𝜀 < 𝑟𝑖(𝑚)
< 2𝜀,
Dengan
𝑠𝑖 =
0 𝑗𝑖𝑘𝑎 𝑟𝑖
(𝑚) ≥ 2𝜀,
𝑟𝑖(𝑚)
𝑗𝑖𝑘𝑎 𝑟𝑖(𝑚)
< 𝜀,
2𝜀
𝑟𝑖 𝑚
− 1 𝑟𝑖 𝑚 𝑗𝑖𝑘𝑎 𝜀 < 𝑟𝑖
𝑚 < 2𝜀.
12
Konstan f tergantung pada residual pada iterasi m tetapi tidak pada nilai dari𝐴 dan
𝑏 . Seperti yang ditunjukkan oleh Lange dan Wu, Majorization Persamaan (2.8)
bertujuan untuk memisahkan parameter pada setiap dimensi ℝ𝑘−1 [12]. Langkah
minimalisasi algoritma MM, mereduksi (k – 1) ridge terkecil dengan ukuran n
daripada satu lebih besar 𝑘 − 1 𝑥 𝑛.
2.6 Apparent Eror Rate (APER)
Apperent Eror Rate (APER)adalah salah satu metode untuk menentukan
nilai kesalahan klasifikasi yang biasa digunakan pada analisis diskriminan. Nilai
APER didefinisikan sebagai fraksi objek pada data uji yang salah klasifikasi
dengan fungsi klasifikasi pada data uji, untuk mempermudah perhitungan dibuat
tabel 2.2 berikut [2].
Tabel 2. 2 Kesalahan klasifikasi (Nilai APER)
Klasifikasi Model
Kel. 𝜋1 𝜋2
Klasifikasi
Sebenarnya
𝜋1 𝑛1𝑐 𝑛1𝑚 = 𝑛1 − 𝑛1𝑐
𝜋2 𝑛2𝑚 = 𝑛2 − 𝑛2𝑐 𝑛2𝑐
𝑛1𝑐 = banyaknya klasifikasi benar pada 𝜋1
𝑛1𝑚 =banyaknya klasifikasi salah pada 𝜋1
𝑛2𝑐 =banyaknya klasifikasi benar pada 𝜋2
𝑛2𝑚 =banyaknya klasifikasi salah pada 𝜋2
Nilai APER kemudian dikenali sebagai proporsi item dalam rangkaian pelatihan
yang salah klasifikasi yang didefinisikan sebagai berikut [2] :
𝐴𝑃𝐸𝑅 =𝑛1𝑚 + 𝑛2𝑚
𝑛1 + 𝑛2.
13
14
BAB III
METODOLOGI PENELITIAN
3.1 Sumber Data
Data yang digunakan dalam penelitian ini adalah datadermatologi yang
berasal dari Merz dan Murphy (1996) yang merupakan hasil pemeriksaan
terhadap 366 pasien yang menderita penyakit erythemato-squamous[8]. Distribusi
366 data tersedia pada tabel 3.1.Untuk tujuan penelitian data dermatologi 366
pasien dibagi menjadi 2 yaitu data latih dan data uji dengan persentase masing-
masing 70% dan 30% tersedia pada lampiran I dan lampiran II.
Tabel 3. 1 Distribusi Kelas Jenis Penyakit Erythemato-Squamous
Kode
Kelompok
Kelompok Jumlah Jumlah
(latih)
Jumlah
(uji)
1 Psoriasis 112 84 28
2 Seboreic dermatitis 61 37 24
3 Lichen planus 72 53 19
4 Pityriasis rosea 49 33 16
5 Cronic dermatitis 52 36 16
6 Pityriasis rubra pilaris 20 13 7
3.2 Data Peubah
Data yang digunakan berasal dari pemeriksaan klinis dan histopatologis.
Tahap pertama dilakukan pemeriksaan klinis yang terdiri dari 12 ciri-ciri pada
pasien, setelah itu sampel kulit diambil untuk dievaluasi 22 ciri-ciri
histopatologisnya. Nilai dari ciri-ciri histopatologis ditentukan dengan analisis
sampel kulit menggunakan mikroskop[8]. Daftar peubah berdasarkan pemeriksaan
klinis tersedia pada tabel 3.2 dan daftar peubah berdasarkan pemeriksaan
histopatologis tersedia pada tabel 3.3.
15
Tabel 3. 2Daftar Peubah Berdasarkan Pemeriksaan Klinis
Peubah Ciri klinis yang diamati Nilai
X1 Erythema 0,1,2,3
X2 Scaling 0,1,2,3
X3 Definite borders 0,1,2,3
X4 Itching 0,1,2,3
X5 Koebner phenomenon 0,1,2,3
X6 Polygonal papules 0,1,2,3
X7 Follicular papules 0,1,2,3
X8 Oral mucosal involvement 0,1,2,3
X9 Knee and elbow involvement 0,1,2,3
X10 Scalp involvement 0,1,2,3
X11 Family history 0 atau 1
X34 Age ≥0 tahun
Tabel 3. 3 Daftar Peubah Hasil Pemeriksaan Histopatologis
X12 Melanin incontinence 0,1,2,3
X13 Eosinophils in the infiltrate 0,1,2,3
X14 PNL infiltrate 0,1,2,3
X15 Fibrosis of the papillary dermis 0,1,2,3
X16 Exocytosis 0,1,2,3
X17 Acanthosis 0,1,2,3
X18 Hyperkeratosis 0,1,2,3
X19 Parakeratosis 0,1,2,3
X20 Clubbing of the rete ridges 0,1,2,3
16
X21 Elongation of the rete ridges 0,1,2,3
X22 Thinning of the suprapapillary epidermis 0,1,2,3
X23 Spongiform pustule 0,1,2,3
X24 Munro microabcess 0,1,2,3
X25 Focal hypergranulosis 0,1,2,3
X26 Disappearance of the granular layer 0,1,2,3
X27 Vacuolisation and damage of basal layer 0,1,2,3
X28 Spongiosis 0,1,2,3
X29 Saw-tooth appearance of retes 0,1,2,3
X30 Follicular horn plug 0,1,2,3
X31 Perifollicular parakeratosis 0,1,2,3
X32 Inflammatory monoluclear infiltrate 0,1,2,3
X33 Band-like infiltrate 0,1,2,3
Secara keseluruhan terdapat 34 ciri-ciri klinis dan histopatologis yang
digunakan dalam penelitian menentukan jenis penyakit erthemato-squamous ini.
Peubahfamily history memiliki nilai 1 untuk pasien yag memiliki riwayat penyakit
yang didiagnosis tersebut dan nilai 0 untuk pasien yang tidak memiliki riwayat
penyakit tersebut. Peubahage adalah umur pasien. Sedangkan ciri-ciri klinis
maupun histopatologis lain memiliki nilai 0 sampai dengan 3, dimana nilai 0
menunjukan tidak terdapatnya ciri-ciri tersebut dan nilai 1 sampai 3 menyatakan
terdapatnya ciri-ciri tersebut. Nilai 3 menunjukan ciri-ciri terbesar yang ada pada
pasien, sedangkan nilai 1 dan 2 adalah ciri-ciri diantaranya[8].
3.3 Metode Analisis
Langkah analisis yang dilakukan penulis untuk mengklasifikasikan jenis
penyakit erythemato-squamousadalah sebagai berikut :
17
I. Penerapan data kasus untuk metode VDAdengan penaltiEuclidean, penalti
lasso dan penalti ridge dengan tahapan analisis sebagai berikut:
i. Membagi data dermatologi menjadi dua, yaitu data latihdan data
ujidengan proporsi 70% dan 30% dari seluruh data (366 data), data latih
digunakan untuk membentuk fungsi diskriminan dan data ujidigunakan
untuk mengevaluasi kesalahan pengklasifikasian.
ii. Membentuk 3 fungsi diskriminan untuk memprediksi data baru masing-
masing menggunakan metode VDAdengan penaltiEuclidean, penalti
lasso dan penalti ridge.
iii. Menghitung nilai APER pada data latihmenggunakan metode VDA
dengan penaltiEuclidean, penalti lasso dan penalti ridge.
iv. Melakukan pengklasifikasian objek baru (data uji) pada fungsi
diskriminandengan penaltiEuclidean, penalti lasso dan penalti ridge yang
telah dibentuk,
v. Menghitung masing-masing nilai APER dengan data uji pada metode
VDA dengan penalti Euclidean, penalti lasso dan penalti ridge.
vi. Membandinganhasil ketepatan klasifikasi jenis penyakit erythemato-
squamousmetode VDA dengan 3 penalti yaitu penalti Euclidean, penalti
lasso dan penalti ridge.
II. Pembentukan fungsi untuk metode VDA
i. Menetapkan iterasi awal 𝑚 = 0, dan inisialisasi 𝐴 0 = 0 𝑑𝑎𝑛 𝑏 0 =
0,
ii. Menentukan simpul dari masing-masing kelompok, definisika 𝑦𝑖 = 𝒗𝒋
dimana 𝒗𝒋telah didefinisikan pada persamaan (2.2),
iii. Majorisasi fungsi kerugian regular sebagaimana ditunjukkan dalam
persamaan (9) dengan residual ke-i 𝑟𝑖 𝑚 = 𝑦𝑖 − 𝑓(𝑥𝑖),
iv. Minimumkan fungsi ridge pengganti dengan weighted least square dan
tentukan 𝐴(𝑚 + 1)dan 𝑏(𝑚 + 1) dengan menyelesaikan set persamaan linier
pada (k – 1),
18
v. Jika 𝐴(𝑚 + 1) − 𝐴(𝑚) < 𝛾 𝑑𝑎𝑛 | 𝑅 (𝜃(𝑚 + 1)) − 𝑅 (𝜃(𝑚)) | < 𝛾
dengan 𝛾 = 10−4keduanya memenuhi maka iterasi berhenti,
vi. Jika tidak, ulangi langkah iii sampai v sampai memenuhi dan fungsi
diskriminan didapatkan.
Pada penelitian ini pembentukan fungsi diskriminan metode VDA dengan
penaltiEuclidean, penalti lasso dan penalti ridgeserta penentuan peubah penjelas
yang berpengaruh terhadap peubah respon dengan metode VDA menggunakan
bantuan software R.
19
3.4 Alur Penelitian
Iterasi 𝑚 = 𝑚 + 1
Tidak
STOP
Iya
Nilai APER
Fungsi diskriminan
VDA terbentuk
𝑑𝑎𝑛 | 𝑅 (𝜃(𝑚 + 1))
− 𝑅 (𝜃(𝑚)) | < 𝛾
Apakah memenuhi
𝐴 𝑚 + 1 − 𝐴 𝑚 <
𝛾
Menentukan titik simpul𝑦𝑖 = 𝑣𝑗
Majorisasi fungsi kerugian dengan
𝑟𝑖(𝑚)
= 𝑦𝑖 − 𝑓(𝑥𝑖)
Menentukan𝐴(𝑚 + 1)dan 𝑏(𝑚 + 1)
Iterasi awal m = 0 𝐴(0) = 0 𝑑𝑎𝑛 𝑏(0) = 0
Data Dermatologi
Data Latih Data Uji
selesai
Gambar 3. 1: Alur Penelitian Metode VDA
20
BAB IV
HASIL DAN PEMBAHASAN
4.1 Deskripsi Data
Hasildeskripsi statistik antara peubah respon (Y) dengan peubah prediktor
(X) pada 6 kelompok jenis penyakit erythemato-squamous tertera pada lampiran I.
Berdasarkan tebel pada lampiran I rata-rata ciri yang sangat terlihat pada
kelompok penyakit psoriasisadalah ciri pada peubahX1, X2, X3, X9, X10, X20,
X21, X22 dan X32. Rata-rata ciri yang sangat terlihat pada kelompok penyakit
seboreic dermatitsadalah ciri pada peubahX1, X2,X4, X17, X16, X28 dan X32.
Rata-rata ciri yang sangat terlihat pada kelompok penyakit lichen planus
adalahciri pada peubahX1, X2, X3, X4, X6, X8, X12, X16,X17, X19, X25, X27,
X29, X32 dan X33. Rata-rata ciri yang sangat terlihat pada kelompok
penyakitpada kelompok penyakit pityriasis roseaadalahciri pada peubahX1, X2,
X16, X28 dan X32. Rata-rata ciri yang sangat terlihat pada kelompok penyakit
cronic dermatitisadalah ciri pada peubahX1, X4, X15, X17, X21 dan X32. Rata-
rata ciri yang sangat terlihat pada kelompok penyakit pityriasis rubra
pilarisadalah ciri pada peubah X1, X2, X7, X9, X16, X17, X30, X31 dan X32.
4.2 Simpul Berjarak Samadi ℝ𝒌−𝟏
Dengan perhitungan menggunakan persamaan (2.1) simpul 𝒗𝒋berjarak sama
di ℝk−1 untuk 6 kelompok tersedia pada tabel 4.1.
Tabel 4. 1 Simpul berjarak sama di ℝ𝑘−1untuk 6 kelompok
𝒗𝟏 𝒗𝟐 𝒗𝟑 𝒗𝟒 𝒗𝟓 𝒗𝟓
0.497 0.7865 -0.3085 -0.3085 -0.3085 -0.3085
0.497 -0.3085 0.7865 -0.3085 -0.3085 -0.3085
0.497 -0.3085 -0.3085 0.7865 -0.3085 -0.3085
0.497 -0.3085 -0.3085 -0.3085 0.7865 -0.3085
0.497 -0.3085 -0.3085 -0.3085 -0.3085 0.7865
21
4.3 Pembentukan Model VDA dengan PenaltiEuclidean
Metode VDA dengan penalti Euclideanmembentuk fungsi diskriminan
dengan bentuk dan hasil analisis yang dilihat pada output yang tersedia pada
lampiran II. Metode VDA dengan penalti Euclideanmembentuk 5 fungsi
diskriminan yaitu 𝑌1,𝑌2,𝑌3,𝑌4,𝑌5untuk membedakan 6 kelompok berdasarkan
banyaknya objek 256 data latih pasien dengan 𝜆 = 0,00390625. Dugaan koefisien
yang dibentuk oleh VDA dengan penalti Euclideanuntuk membentuk fungsi
diskriminan𝑌1,𝑌2,𝑌3,𝑌4,𝑌5 disajikan pada lampiran IV.
Ketepatan klasifikasi model diskriminan data latih yang terdiri dari 256 data
pasien menggunakan metode VDA dengan penalti Euclideanpada setiap
kelompok dapat dilihat pada tabel 4.2.
Tabel 4. 2 Ketepatan Model VDA dengan PenaltiEuclideanpada Data Latih
Klasifikasi metode VDA dengan penalti Euclidean Banyak
objek Kelompok I II III IV V VI
Klasifikasi
sebenarnya
I 84 0 0 0 0 0 84
II 0 37 0 0 0 0 37
III 0 0 53 0 0 0 53
IV 0 2 0 31 0 0 33
V 0 0 0 0 36 0 36
VI 0 0 0 0 0 13 13
Tabel 4.2 menunjukan bahwa banyaknya objek yang diklasifikasikan secara
tepat oleh ke 5 fungsi diskriminan menggunakan metode VDA dengan penalti
Euclideanadalah sebanyak 253 data dari 256 data, artinya hanya terdapat 3 objek
yang pengklasifikasiannya tidak tepat dengan kata lain berbeda dengan klasifikasi
sebenarnya. Artinya metode VDA dengan penalti Euclideanpada data latih
melakukan klasifikasi secara tepat sebesar 0.9921875dengan APER sebesar
0.0078125.
Setelah fungsi diskriminan terbentuk, selanjutnya dilakukan evaluasi pada
110 data uji. Misalkan klasifikasi dilakukan pada data uji pasien nomer 1 secara
manual, dengan klasifikasi sebenarnya pasien nomer 1 data uji termasuk ke dalam
22
pasien yang didiagnosa memiliki penyakit seboreic dermatitis (kelompok 2).
Simpul untuk 6 kelompok, jarak antara nilai objek dan simpul, dan dugaan
klasifikasi pada data ujipasien nomer 1 tersedia pada tabel 4.3.
Tabel 4. 3Jarak Antar Objek dengan Simpul menggunakan Metode VDA dengan
PenaltiEuclideanpada Data Pasien 1
Kel. 𝒗𝒋 𝒗𝒋 − 𝑪 𝑥𝑖 − 𝒃 Kel. 𝒗𝒋 𝒗𝒋 − 𝑪 𝑥𝑖 − 𝒃
1 𝑣1 0.497 1.330911 4 𝑣4 -0.3085 0.986556
0.497
-0.3085
0.497
0.7865
0.497
-0.3085
0.497
-0.3085
2 𝑣2 0.7865 0.761542 5 𝑣5 -0.3085 0.972556
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085
0.7865
-0.3085
-0.3085
3 𝑣3 -0.3085 1.336048 6 𝑣6 -0.3085 1.209922
0.7865
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085 0.7865
Nilai masing-masing data peubah pasien nomer 1 disubstitusike dalam 5
fungsi diskriminan yang telah dibentuk, sehingga diperoleh nilai 𝑌1 =
0.153227,𝑌2 = −0.06976, 𝑌3
= 0.03603, 𝑌4 =-0.04451, 𝑌5
=-0.22965.
Berdasarkan nilai jarak terkecil antara objek dengan simpul pada tabel 4.3 untuk 6
kelompok, data uji pasien nomer 1 diklasifikasikan ke dalam kelompok 2. Hal ini
sesuai dengan klasifikasi sebenarnya, oleh karna itu hasil klasifikasi metode VDA
ini mengklasifikasikan dengan tepat data uji pasien nomer 1.
Ketepatan klasifikasi model diskriminan data uji menggunakan metode
VDA dengan penalti Euclideanpada setiap kelompok dapat dilihat pada tabel
23
4.4.Tabel 4.4 menunjukan bahwa banyaknya objek yang diklasifikasikan secara
tepat oleh ke 5 fungsi diskriminan menggunakan metode VDA dengan penalti
Euclidean adalah sebanyak 104 data dari 110 data, artinya terdapat 6 objek yang
diklasifikasikan salah atau tidak sama dengan klasifikasi sebenarnya.Metode
VDA dengan penalti Euclidean npada data uji melakukan klasifikasi secara tepat
sebesar 0,9272727 dengan APER sebesar 0,0727272.
Tabel 4. 4Ketepatan Model VDA dengan PenaltiEuclidean pada Data Uji
Klasifikasi model Banyak
objek Kelompok I II III IV V VI
klasifikasi
sebenarnya
I 27 1 0 0 0 0 28
II 1 20 0 3 0 0 24
III 0 0 19 0 0 0 19
IV 0 1 0 15 0 0 16
V 0 0 0 0 16 0 16
VI 0 0 0 0 0 7 7
Banyak objek 110
Berdasarkan pembentukan fungsi diskriminan menggunakan metode VDA
dengan penalti Euclideanyang tertera pada lampiran II dengan koefisien parameter
yang tidak sama dengan 0 diperoleh 27 peubah penjelas yaitu 12 ciri-ciri klinis
dan 15 ciri-ciri histopatologis yang berpengaruh terhadap peubah respon (Y)
kelompok jenis penyakit erythemato-squamous, antara lain adalah peubah "X1",
"X2", "X3", "X4", "X5", "X6", "X7", "X8", "X9", "X10", "X11", "X12”,
"X13", "X14", "X15", "X16", "X17", "X19", "X20", "X21", "X25", "X26" "X27",
"X28", "X30", "X32", "X34". Peubah penjelas yang tidak berpengaruh adalah 7
ciri-ciri histopatologisnya yaitu "X18", "X22", "X23", "X24", "X29", "X31",
"X33" masing-masing adalah ciri-ciri hyperkeratosis, Thinning of the
suprapapillary epidermis, Spongiform pustule, Munro microabcess, Saw-tooth
appearance of retes, Perifollicular parakeratosis, danInflammatory monoluclear
infiltrate.
4.4 Pembentukan Model VDA dengan Penalti Lasso
Metode VDA dengan penalti lasso membentuk fungsi diskriminan dengan
bentuk dan hasil analisis dapat dilihat pada output VDA dengan penalti lasso yang
tersedia padalampiran III. Metode VDA dengan penalti lasso membentuk 5 fungsi
24
diskriminan untuk membedakan 6 kelompok berdasarkan banyaknya objek 256
data pasien dengan 𝜆 = 0.02. Dugaan koefisien yang dibentuk oleh VDA dengan
penalti Euclideanuntuk membentuk fungsi diskriminan𝑌1,𝑌2,𝑌3,𝑌4,𝑌5 disajikan
pada lampiran VI.
Ketepatan klasifikasi model diskriminan data latih yang terdiri dari 256 data
pasien menggunakan metode VDA dengan penalti lassopada setiap kelompok
dapat dilihat pada tabel 4.5.
Tabel 4. 5Ketepatan Model VDA dengan Penalti Lasso pada Data Latih
Klasifikasi metode VDA dengan penalti lasso Banyak
objek Kelompok I II III IV V VI
Klasifikasi
sebenarnya
I 83 1 0 0 0 0 84
II 0 37 0 0 0 0 37
III 0 0 51 2 0 0 53
IV 0 4 0 29 0 0 33
V 1 0 0 0 35 0 36
VI 1 0 0 0 0 12 13
Pada tabel 4.5 menunjukan bahwa banyaknya objek yang diklasifikasikan
secara tepat oleh ke 5 fungsi diskriminan menggunakan metode VDA dengan
penalti lasso adalah sebanyak 254 data dari 256 data, artinya hanya terdapat
2objek yang pengklasifikasiannya kurang tepat dengan kata lain berbeda dengan
klasifikasi sebenarnya. Artinya metode VDA dengan penalti lasso pada data latih
melakukan klasifikasi secara tepat sebesar 0,96484375 denganAPER sebesar
0,03515625.
Setelah fungsi diskriminan terbentuk, selanjutnya dilakukan evaluasi pada
data ujisebanyak 110 data. Misalkan klasifikasi dilakukan pada data ujipasien
nomer 1 secara manual,dengan klasifikasi sebenarnya pasien nomer 1 data uji
termasuk ke dalam pasien yang didiagnosa memiliki penyakit seboreic
dermatitis(kelompok 2). Nilai untuk masing-masing peubah pasien nomer 1 pada
data uji.
25
Dengan mensubstitusi data pasien 1 dengan 5 fungsi diskriminan yang telah
terbentuk didapatkan jarak antar objek dengan simpulsehingga mendapatkan
dugaan klasifikasi pada data tersebut.Simpul untuk 6 kelompok, jarak antara nilai
objek dan simpul, dan dugaan klasifikasi pada data ujipasien nomer 1 tersedia
pada tabel 4.6.
Tabel 4. 6Jarak Antar Objek dengan Simpul menggunakan Metode VDA dengan
Penalti Lasso pada Data Pasien 1
Kel. 𝒗𝒋 𝒗𝒋 − 𝑪 𝑥𝑖 − 𝒃 Kel. 𝒗𝒋 𝒗𝒋 − 𝑪 𝑥𝑖 − 𝒃
1 𝑣1 0.497 1.23598818 4 𝑣4 -0.3085 0.911962482
0.497
-0.3085
0.497
0.7865
0.497
-0.3085
0.497
-0.3085
2 𝑣2 0.7865 0.84251806 5 𝑣5 -0.3085 1.01010607
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085
0.7865
-0.3085
-0.3085
3 𝑣3 -0.3085 1.11310441 6 𝑣6 -0.3085 1.155293311
0.7865
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085 0.7865
Nilai masing-masing data peubah pasien nomer 1 disubstitusike dalam 5
fungsi diskriminan yang telah dibentuk, sehingga diperoleh nilai 𝑌1 =
0.194315,𝑌2 = −0.35595, 𝑌3
= 0.014705, 𝑌4 =0.027229, 𝑌5
=-0.20932.
Berdasarkan nilai jarak terkecil antara objek dengan simpul pada tabel 4.4 pada 6
kelompok, data uji pasien nomer 1 diklasifikasikan ke dalam kelompok 2. Hal ini
sesuai dengan klasifikasi sebenarnya, oleh karna itu hasil klasifikasi metode VDA
dengan penalti lasso ini mengklasifikasikan dengan tepat data uji pasien nomer 1.
26
Ketepatan klasifikasi model diskriminan data uji menggunakan metode
VDA dengan penalti lasso pada setiap kelompok dapat dilihat pada tabel 4.7.
Tabel 4.7 menunjukan bahwa banyaknya objek yang diklasifikasikan secara tepat
oleh ke 5 fungsi diskriminan menggunakan metode VDA dengan penalti lasso
adalah sebanyak 102 data dari 110 data, artinya hanya terdapat 8 objek yang
diklasifikasikan salah atau tidak sama dengan klasifikasi sebenarnya. Metode
VDA dengan penalti lasso pada data uji melakukan klasifikasi secara tepat sebesar
0,9454545 dengan APER sebesar 0,0545454.
Tabel 4. 7.Hasil Klasifikasi Metode VDA dengan Penalti Lasso pada Data Uji
Klasifikasi model Banyak
objek Kelompok I II III IV V VI
klasifikasi
sebenarnya
I 27 1 0 0 0 0 28
II 0 18 0 5 1 0 24
III 0 0 19 0 0 0 19
IV 0 1 0 15 0 0 16
V 0 0 0 0 16 0 16
VI 0 0 0 0 0 7 7
Banyak objek 110
Berdasarkan pembentukan fungsi diskriminan menggunakan metode VDA
dengan penalti lasso yang tertera pada lampiran III dengan koefisien parameter
yang tidak sama dengan 0 diperoleh 25 peubah penjelas yaitu 11 ciri-ciri klinis
dan 14 ciri-ciri histopatologis yang berpengaruh terhadap peubah respon (Y)
kelompok jenis penyakit erythemato-squamous, antara lain adalah peubah "X1",
"X2", "X3", "X4", "X5", "X6", "X7", "X8", "X9", "X10", "X11", "X12”, "X13",
"X14", "X15", "X16", "X17", "X20", "X21","X22", "X25", "X27", "X28", "X29”.
Peubah penjelas yang tidak berpengaruh adalah 9 ciri-ciri histopatologisnya yaitu
"X18", “X19”, "X23", "X24", "X26", "X30", "X31", "X32", "X33", "X34"masing-
masing adalah ciri-cirihyperkeratosis, Parakeratosis, Spongiform pustule, Munro
microabcess, Disappearance of the ganuar layer, Follicular horn plug,
Perifollicular parakeratosis,Inflammatory monoluclear infiltrate, Band like
infiltrate,dan Age.
27
4.5 Pembentukan Model VDA dengan Penalti Ridge
Metode VDA dengan penalti ridge membentuk fungsi diskriminan dengan
bentuk dan hasil analisis dapat dilihat pada output yang tersedia pada lampiran IV.
Metode VDA dengan penalti ridge membentuk 5 fungsi diskriminan untuk
membedakan 6 kelompok berdasarkan banyaknya objek 256 data pasien dengan
𝜆 = 0,05. Dugaan koefisien yang dibentuk oleh VDA dengan penaltiridge untuk
membentuk fungsi diskriminan𝑌1,𝑌2,𝑌3,𝑌4,𝑌5 disajikan pada lampiran VII.
Ketepatan klasifikasi model diskriminan data latih yang terdiri dari 256 data
pasien menggunakan metode VDA dengan penalti ridge pada setiap kelompok
dapat dilihat pada tabel 4.8.
Tabel 4. 8Ketepatan Model VDA dengan Penalti Ridge pada Data Latih
Klasifikasi metode VDA dengan penalti ridge Banyak
objek Kelompok I II III IV V VI
Klasifikasi
sebenarnya
I 84 0 0 0 0 0 84
II 0 37 0 0 0 0 37
III 0 0 53 0 0 0 53
IV 0 2 0 31 0 0 33
V 0 0 0 0 36 0 36
VI 0 0 0 0 0 13 13
Tabel 4.8 menunjukan bahwa banyaknya objek yang diklasifikasikan secara
tepat oleh ke 5 fungsi diskriminan menggunakan metode VDA dengan penalti
ridge adalah sebanyak 254 data dari 256 data, artinya hanya terdapat 2 objek yang
pengklasifikasiannya tidak tepat dengan kata lain berbeda dengan klasifikasi
sebenarnya. Artinya metode VDA dengan penaltiridge pada data latih melakukan
klasifikasi secara tepat sebesar 0,9921875 dengan APER sebesar 0.0078125.
Setelah fungsi diskriminan terbentuk, selanjutnya dilakukan evaluasi pada
data uji sebanyak 110 data. Misalkan klasifikasi dilakukan pada data uji pasien
nomer 1 secara manual, dengan klasifikasi sebenarnya pasien nomer 1 data uji
termasuk ke dalam pasien yang didiagnosa memiliki penyakit seboreic dermatitis
28
(kelompok 2). Simpul untuk 6 kelompok, jarak antara nilai objek dan simpul, dan
dugaan klasifikasi pada data ujipasien nomer 1 tersedia pada tabel 4.9.
Nilai masing-masing data peubah pasien nomer 1 disubstitusike dalam 5
fungsi diskriminan yang telah dibentuk, sehingga diperoleh nilai 𝑌1 =
0.13494,𝑌2 = −0.1204, 𝑌3
= 0.003641, 𝑌4 =-0.0225, 𝑌5
=-0.13854.
Berdasarkan nilai jarak terkecil antara objek dengan simpul pada tabel 4.9 untuk 6
kelompok, data uji pasien nomer 1 diklasifikasikan ke dalam kelompok 2. Hal ini
sesuai dengan klasifikasi sebenarnya, oleh karna itu hasil klasifikasi metode VDA
dengan penalti rigde ini mengklasifikasikan dengan tepat data uji pasien nomer 1.
Ketepatan klasifikasi model diskriminan data uji menggunakan metode VDA pada
setiap kelompok dapat dilihat pada tabel 4.10.
Tabel 4. 9Jarak Antar Objek dengan Simpul menggunakan Metode VDA
dengan Penalti Ridge pada Data Pasien 1
Kel. 𝒗𝒋 𝒗𝒋 − 𝑪 𝑥𝑖 − 𝒃 Kel. 𝒗𝒋 𝒗𝒋 − 𝑪 𝑥𝑖 − 𝒃
1 𝑣1 0.497 1.195603 4 𝑣4 -0.3085 0.977534
0.497
-0.3085
0.497
0.7865
0.497
-0.3085
0.497
-0.3085
2 𝑣2 0.7865 0.817329 5 𝑣5 -0.3085 1.006385
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085
0.7865
-0.3085
-0.3085
3 𝑣3 -0.3085 1.107804 6 𝑣6 -0.3085 1.125589
0.7865
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085
-0.3085 0.7865
29
Tabel 4.10 menunjukan bahwa banyaknya objek yang diklasifikasikan
secara tepat oleh ke 5 fungsi diskriminan menggunakan metode VDA dengan
penalti ridge adalah sebanyak 107 data dari 110 data, artinya terdapat 3 objek
yang diklasifikasikan salah atau tidak sama dengan klasifikasi sebenarnya.Artinya
metode VDA dengan penalti ridge pada data uji juga melakukan klasifikasi secara
tepat sebesar 0,9727273 dengan APER 0,0272727.
Tabel 4. 10Ketepatan Model VDA dengan Penalti Ridge pada Data Uji
Klasifikasi model Banyak
objek Kelompok I II III IV V VI
klasifikasi
sebenarnya
I 28 0 0 0 0 0 28
II 0 22 0 2 0 0 24
III 0 0 19 0 0 0 19
IV 0 1 0 15 0 0 16
V 0 0 0 0 16 0 16
VI 0 0 0 0 0 7 7
Banyak objek 110
Berdasarkan pembentukan fungsi diskriminan menggunakan metode VDA
dengan penalti ridge yang tertera pada lampiran IV dengan koefisien parameter
yang tidak sama dengan 0 untuk semua peubah penjelas yaitu 12 ciri-ciri klinis
dan 22 ciri-ciri histopatologis yang berpengaruh terhadap peubah respon (Y)
kelompok jenis penyakit erythemato-squamous.Pembentukan fungsi diskriminan
menggunakan metode VDA dengan penalti ridge tidak melakukan seleksi peubah
tetapi hanya memperkecil koefisien parameter yang berkorelasi mendekati nilai
nol.
30
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil dan pembahasan dari data dermatologi jenis penyakit
erythemato-squamous pada 34 peubah berdasarkan 12 ciri-ciri klinis dan 22 ciri-
ciri histopatologi menggunakan metode VDAdengan penaltiEuclidean, penalti
lasso dan penalti ridge dapat disimpulkan bahwa :
Hasil Ketepatan Klasifikasi
PenaltiEuclidean Penalti Lasso PenaltiRidge
Lamda 0.00390625 0.02 0.05
Data Latih 0.9921875 0.96484375 0.9921875
Data Uji 0.9272727 0.9454545 0.97272727
Nilai APER
PenaltiEuclidean Penalti Lasso Penalti Ridge
Data Latih 0.0078125 0.03515625 0.0078125
Data Uji 0.0727272 0.0545454 0.0272727
Rata-rata 0.0402698 0.04485085 0.0175426
Berdasarkan perbandingan hasil klasifikasi yang diperoleh menggunakan
metode VDA dengan penaltiEuclidean, penalti lasso dan penalti ridgepada data
jenis penyakit erythemato-squamousdiperoleh bahwa ketepatan klasifikasi metode
VDA dengan penaltiridge memiliki nilai APER terkecil yaitu0,0175426
dibandingkan dengan metode VDA menggunakan penalti Euclideandan penalti
lasso. Metode VDA dengan penalti ridge ini dapat dijadikan alternatif untuk
pengklasifikasian jenis penyakit erythemato-squamous karna hasil klasifikasinya
yang sangat baik.
5.2 Saran
Pada penelitian ini digunakan metode VDA pada kasus multikategori linier
dengan membandingkan penaltiEuclidean, penalti lasso dan penalti ridge yang
diaplikasikan pada data jenis penyakit erythemato-squamous, pada penelitian
selanjutnya dapat mengkaji lebih dalam mengenai metode VDA terbaru yaitu
31
metode VDA berbasis RKHS yang dapat diterapkan pada kasus multikategori
non-linier. Pada penelitian selanjutnya juga dapat melakukan perbandingan
metode VDA dan metode VDA berbasis RKHS menggunakan data simulasi
multikategori non linier maupun kasus data lain untuk mengetahui metode yang
lebih baik diantara kedua metode tersebut.
32
REFERENSI
[1] Hestie T, Tibshirani R, Friedman J. 2008. The Elements of Statistical
Learning. Data Mining, Inference, and Prediction. Standford California (US):
Springer. Ed ke-2.
[2] Johnson RA, Wichern DW. (2007). Applied Multivariate Statistical Analysis
Edisi ke enam. New Jersey (US): Pearson Prentice Hall.
[3] Kurnia H. (2015). Perbandingan Vertex Discriminant Analysis (VDA) dan
Quadratic Discriminant Analysis (QDA)[Tesis]. Bogor: Institute Pertanian
Bogor.
[4] Kustiyo A. (2004). Model Neural Network dengan Inisialisasi Pembobot Awal
Menggunakan Regresi Logistik Biner untuk Memprediksi Jenis Penyakit
Erythemato-squamous [Tesis]. Surabaya: Fakultas Teknologi Informasi,
Institut Teknologi Sepuluh November.
[5] Lange K, Wu TT. (2008). An MM Algorithm for Multicategory Vertex
Discriminant Analysis. J Computational Graphical Statistics 17(3) : 527-544.
[6] Lange K, Wu TT. (2010). Multicategory Vertex Discriminant Analysis For
High-Dimensional Data. The Annals of Applied Statistics 4(4) : 1698-1721.
[7] Matjik AA, Sumertajaya IM. 2011. Sidik Peubah Ganda. Bogor (ID): IPB PR.
[8] Merz, C. and Murphy, P.M. (1996). UCI Repository of Machine Learning
Databases [http://www.ics.uci.edu/pub/machine-learningdatabases] University
of California, Irvine, Depart-ment of Information and Computer Science.
[9] Nielsen AA, Canty MJ. (2008). Kernel Principal Component Analysis for
Change Detection. Image and Signal for Remote Sensing XIV. 7109.
Doi:10.1117 /12.800141.
[10] Nurmaleni. (2015). Perbandingan Metode Klasifikasi Antara Analisis
Diskriminan Verteks dan Diskriminan Fisher [Tesis]. Bogor: Institute
Pertanian Bogor.
[11] Schölkopf B, Smola AJ. 2002. Learning with Kernels. Cambridge: The MIT
Press.
33
[12] Wu TT, Wu Y. (2012). Nonlinier Vertex Discriminant Analysis with
Reproducing Kernels. NIH Public Access 5(2): 167-176.
34
Lampiran IDeskripsi Statistik Data Dermatologi 366 Pasien
Variabel
Rata-
rata
Std.
Deviasi Rata-rata
Std.
Deviasi Rata-rata
Std.
Deviasi
KELOMPOK I KELOMPOK II KELOMPOK III
x1 2.29 0.621 2.28 0.609 2.08 0.599
x2 2.20 0.627 2.07 0.544 1.63 0.659
x3 2.10 0.584 0.95 0.805 2.10 0.675
x4 0.95 1.089 1.62 0.952 2.28 0.791
x5 0.67 0.874 0.03 0.256 1.35 1.050
x6 0.00 0.000 0.00 0.000 2.28 0.697
x7 0.04 0.230 0.02 0.128 0.00 0.000
x8 0.00 0.000 0.00 0.000 1.92 0.765
x9 1.63 1.004 0.07 0.250 0.03 0.236
x10 1.53 0.977 0.11 0.412 0.03 0.165
x11 0.29 0.454 0.05 0.218 0.01 0.118
x12 0.00 0.000 0.00 0.000 2.06 0.669
x13 0.04 0.230 0.46 0.673 0.17 0.444
x14 1.12 0.908 1.08 0.822 0.00 0.000
x15 0.00 0.000 0.00 0.000 0.06 0.331
x16 0.27 0.629 2.20 0.703 2.26 0.671
x17 2.10 0.629 1.77 0.761 2.11 0.662
x18 0.82 0.903 0.21 0.520 0.29 0.542
x19 2.00 0.644 0.98 0.940 1.21 0.855
x20 2.12 0.732 0.00 0.000 0.00 0.000
x21 2.26 0.626 0.16 0.489 0.00 0.000
x22 2.05 0.757 0.02 0.128 0.00 0.000
x23 0.86 0.938 0.16 0.454 0.00 0.000
x24 1.15 0.951 0.00 0.000 0.04 0.354
x25 0.00 0.000 0.00 0.000 1.99 0.702
x26 1.20 1.114 0.00 0.000 0.24 0.639
x27 0.01 0.094 0.00 0.000 2.31 0.597
x28 0.00 0.000 2.16 0.778 1.10 1.177
x29 0.00 0.000 0.00 0.000 2.29 0.638
x30 0.00 0.000 0.02 0.128 0.01 0.118
x31 0.00 0.000 0.02 0.128 0.00 0.000
x32 1.87 0.717 1.61 0.781 2.25 0.599
x33 0.03 0.211 0.03 0.256 2.72 0.451
x34 39.16 15.751 35.64 13.533 40.11 11.752
35
Variabel
Rata-
rata
Std.
Deviasi Rata-rata
Std.
Deviasi Rata-rata
Std.
Deviasi
KELOMPOK IV KELOMPOK V KELOMPOK VI
x1 1.90 0.586 1.50 0.672 2.05 0.510
x2 1.51 0.505 1.13 0.627 1.75 0.444
x3 1.18 0.727 0.85 0.894 1.05 0.759
x4 0.47 0.767 1.88 1.041 0.50 0.607
x5 1.18 0.808 0.00 0.000 0.00 0.000
x6 0.00 0.000 0.00 0.000 0.00 0.000
x7 0.00 0.000 0.23 0.546 2.20 0.616
x8 0.00 0.000 0.00 0.000 0.00 0.000
x9 0.00 0.000 0.04 0.194 1.70 0.801
x10 0.00 0.000 0.00 0.000 0.50 0.827
x11 0.00 0.000 0.00 0.000 0.50 0.513
x12 0.00 0.000 0.00 0.000 0.00 0.000
x13 0.06 0.242 0.08 0.269 0.00 0.000
x14 0.12 0.331 0.00 0.000 0.15 0.366
x15 0.00 0.000 2.29 0.723 0.00 0.000
x16 2.04 0.706 0.85 0.777 1.50 0.827
x17 1.45 0.647 2.25 0.682 1.65 0.587
x18 0.31 0.585 0.69 0.805 0.80 0.616
x19 0.76 0.630 0.75 0.860 1.25 0.639
x20 0.00 0.000 0.08 0.334 0.10 0.308
x21 0.00 0.000 1.88 0.832 0.10 0.308
x22 0.00 0.000 0.02 0.139 0.00 0.000
x23 0.00 0.000 0.02 0.139 0.05 0.224
x24 0.02 0.143 0.00 0.000 0.00 0.000
x25 0.00 0.000 0.00 0.000 0.05 0.224
x26 0.39 0.533 0.00 0.000 0.00 0.000
x27 0.00 0.000 0.00 0.000 0.00 0.000
x28 1.96 0.706 0.35 0.711 1.20 1.005
x29 0.02 0.143 0.00 0.000 0.00 0.000
36
x30 0.00 0.000 0.02 0.139 1.75 0.851
x31 0.00 0.000 0.00 0.000 2.05 0.605
x32 1.78 0.621 1.83 0.760 1.60 0.681
x33 0.00 0.000 0.02 0.139 0.05 0.224
x34 35.08 13.882 36.63 15.046 10.25 3.712
37
Lampiran II Output VDA dengan PenaltiEuclidean
library(VDA)
library(csv)
Data1 <- read.csv(file.choose(), header=TRUE)
x <- Data1[,1:34]
y <- Data1[,35]
lam1 <- (1:5)/100
lam2 <- (1:5)/100
cveuclid<- cv.vda.le(x, y, kfold = 3, lam.vec.1 = 0, lam.vec.2 =
exp(1:10)/1000)
plot(cveuclid)
outeuclid <-vda.le(x,y)
> print(outeuclid)
> summary(outeuclid)
Call:
vda.le.default(x, y)
# of cases= 256
# of classes= 6
# of features= 34
Lambdas used: 0.00390625 0.01
Predicted classification:
[1] 3 2 1 2 1 5 1 4 3 4 3 1 5 1 2 1 5 5 5 1 5 5 5 6 4 3 3 2 1 1 5 3 4 1 5 1 1
[38] 3 1 5 2 2 4 6 2 1 4 5 1 3 1 1 3 1 4 4 6 6 3 1 4 3 3 4 1 2 6 2 6 2 3 3 3 3
[75] 1 6 2 1 2 1 2 1 3 2 2 1 3 1 1 1 6 3 4 3 1 2 2 1 6 3 2 2 1 5 4 5 5 3 1 5 1
[112] 3 2 1 1 3 2 5 1 2 4 1 1 4 1 1 3 1 5 1 1 2 5 1 6 3 2 3 4 1 3 3 3 4 3 5 2 3
38
[149] 3 2 5 1 1 4 1 5 1 5 3 1 4 3 1 1 1 3 3 3 5 1 2 2 4 1 3 1 4 3 1 1 5 4 5 1 1
[186] 1 4 2 1 4 6 1 1 4 2 1 1 2 5 1 5 4 3 1 1 3 5 3 3 5 6 2 1 4 5 1 6 5 1 2 1 1
[223] 3 1 2 2 1 3 1 4 1 2 1 4 3 2 2 5 3 1 4 4 1 2 1 3 3 4 3 5 5 1 3 1 3 5
Training error:
[1] 0.0078125
Coefficients:
intercept X1 X2 X3 X4 X5
[1,] 0.1226691 0.010188451 0.0524411 7.177107e-06 0.0102354 -0.0265850
[2,] 0.0877730 -0.007688866 -0.0259024 9.937106e-06 0.0297396 0.0485372
[3,] 0.0853367 -0.004776176 0.0276314 1.376230e-05 -0.0442570 0.0773558
[4,] 0.0531161 -0.000190053 -0.0204139 5.270494e-08 0.0261845 -0.0131196
[5,] -0.0110466 0.008069711 0.0313539 4.808869e-06 -0.0127536 0.0195757
X6 X7 X8 X9 X10 X11
[1,] -0.06436324 -0.1004200 0.00000000 0.04126795 0.0732569 -0.006115366
[2,] 0.08031842 -0.0163438 0.06619783 0.05689553 0.0844408 0.000000000
[3,] -0.05915110 -0.0988262 -0.05303395 0.00959180 0.0225153 -0.000555544
[4,] -0.00879325 -0.0229949 -0.02716729 0.03840578 0.0404484 0.000000000
[5,] -0.00711559 0.0709199 0.00580917 0.09029100 0.0973098 0.034079245
X12 X13 X14 X15 X16
[1,] -0.003213851 0.011453305 0.05092013 -0.03866981 0.013682203
[2,] 0.045568825 -0.002923342 0.03877116 0.00000000 0.002650122
[3,] -0.006372379 -0.004655644 0.00000000 -0.03272950 -0.014208656
39
[4,] -0.015943912 -0.003658466 0.00000000 0.12004689 -0.080449031
[5,] -0.002701922 0.000000000 0.02600023 -0.02660579 -0.038207183
X17 X18 X19 X20 X21 X22 X23 X24
[1,] 0.0027754047 0 0.0000000000 0.000000000 0.000000000 0 0 0
[2,] 0.0023514993 0 0.0037518698 0.010175260 0.024398847 0 0 0
[3,] -0.0067719670 0 0.0051084362 0.000000000 0.002532856 0 0 0
[4,] 0.0047924123 0 0.0003263386 0.013228880 0.072651247 0 0 0
[5,] -0.0005084491 0 0.0024029054 0.009211449 0.030360037 0 0 0
X25 X26 X27 X28 X29 X30 X31
[1,] -0.0004245413 -0.018678585 -0.001872705 0.013103551 0 -0.007436386 0
[2,] 0.0023149094 0.000000000 0.017442730 -0.029748003 0 -0.002913243 0
[3,] -0.0005062592 0.009988018 -0.002473465 0.008002987 0 -0.004399203 0
[4,] 0.0000000000 0.000000000 0.000000000 -0.063685921 0 -0.002636071 0
[5,] 0.0000000000 -0.007462407 0.000000000 -0.013220904 0 0.007111264 0
X32X33 X34
[1,] 0.000000000 0 0.004209829
[2,] 0.009870899 0 0.003098623
[3,] 0.003040760 0 0.000512731
[4,] 0.014402282 0 0.000000000
[5,] 0.000000000 0 -0.001162476
Number of Active Variables:
[1] 27
40
Selected Variables with Nonzero Coefficients:
[1] "X1" "X2" "X3" "X4" "X5" "X6" "X7" "X8" "X9" "X10" "X11"
"X12"
[13] "X13" "X14" "X15" "X16" "X17" "X19" "X20" "X21" "X25" "X26" "X27"
"X28"
[25] "X30" "X32" "X34"
Data2 <- read.csv(file.choose(), header=TRUE)
z <- Data2[,1:34]
testingcases <- data.matrix(z, rownames.force = NA)
predict(outeuclid, testingcases)
[1] 2 6 2 4 2 2 4 1 1 4 1 1 3 5 4 2 2 3 1 3 5 3 1 3 5 6 5 2 1 4 1 1 4 1 5 6 1
[38] 3 2 4 1 1 4 3 1 4 1 1 6 4 3 2 2 2 3 2 1 4 2 2 1 1 1 5 3 2 4 5 1 5 4 2 1 2
[75] 2 3 3 1 6 1 2 3 5 3 1 2 6 3 5 5 4 4 4 1 1 5 4 5 5 2 3 6 3 5 3 5 1 3 4 2
41
Lampiran III Output VDA dengan Penalti Lasso
library(VDA)
library(csv)
Data1 <- read.csv(file.choose(), header=TRUE)
x <- Data1[,1:34]
y <- Data1[,35]
lam1 <- (1:5)/100
lam2 <- (1:5)/100
cvlasso <- cv.vda.le(x, y, kfold = 3, lam.vec.1 = exp(1:10)/1000, lam.vec.2 =
0)
plot(cvlasso)
outlasso <-vda.le(x,y,lambda1=.02,lambda2=0)
print(outlasso)
summary(outlasso)
Call:
vda.le.default(x, y, lambda1 = 0.02, lambda2 = 0)
# of cases= 256
# of classes= 6
# of features= 34
Lambdas used: 0.02 0
Predicted classification:
[1] 3 2 1 2 1 5 1 4 3 4 3 1 5 1 2 1 5 5 5 1 5 5 5 6 4 3 3 2 1 1 5 3 4 1 5 1 1
[38] 3 1 5 2 2 4 6 2 1 4 5 1 3 1 1 3 1 4 4 6 6 3 1 4 3 3 4 1 2 6 2 6 2 3 4 3 3
[75] 1 6 2 1 2 1 2 1 3 2 2 1 3 1 1 1 6 3 4 3 1 2 2 1 6 3 2 2 1 5 4 5 5 3 1 5 1
[112] 3 2 1 1 3 2 5 1 2 4 1 1 4 1 1 3 1 5 1 1 2 5 1 6 3 2 3 4 1 3 3 3 4 3 5 2 3
42
[149] 3 2 5 1 1 4 1 5 1 5 3 2 2 3 1 1 1 3 3 3 5 1 2 2 4 1 3 1 4 3 1 1 5 4 5 1 1
[186] 1 4 2 1 4 6 1 1 2 2 1 1 2 5 1 5 4 3 1 1 3 5 3 3 5 1 2 1 4 1 1 6 5 1 2 1 1
[223] 3 1 2 2 1 3 1 4 1 2 1 4 3 2 2 5 3 1 4 4 1 2 1 3 3 4 3 5 5 1 4 1 3 5
Training error:
[1] 0.03515625
Coefficients:
intercept X1 X2 X3 X4 X5
[1,] 0.16557457 0.06920843 0.146448540 -0.03962667 -0.009612442 -0.03300337
[2,] 0.20784915 -0.01136693 0.005246624 0.19490486 0.098541864 0.03601689
[3,] 0.09822989 0.00000000 0.015764372 0.00000000 -0.127490457 0.10762828
[4,] 0.06395670 -0.06900479 -0.053347804 0.00000000 0.061684189 -0.05195387
[5,] 0.01246806 0.03437746 0.043376951 0.00000000 -0.020381713 0.00000000
X6 X7 X8 X9 X10 X11
[1,] -0.10558938 -0.091194291 0.00000000 0.042822158 0.06242276 0.00000000
[2,] 0.17174541 -0.004677335 0.04995914 0.092877295 0.07890327 0.00000000
[3,] -0.05556989 -0.098446917 -0.04277658 0.003633732 0.04412943 0.00000000
[4,] 0.00000000 -0.024362969 -0.03776891 0.024720129 0.04565799 0.00000000
[5,] 0.00000000 0.122198434 0.00000000 0.100193116 0.09192552 0.04310113
X12 X13 X14 X15 X16 X17
[1,] 0.00000000 0.017379950 0.088514062 -0.03958132 0.000000000 0.000000
[2,] 0.04040128 0.000000000 0.009886065 0.00000000 -0.0095570292 0.000000
[3,] 0.0000000 -0.000303028 0.00000000 -0.02872535 -0.0076264041 -0.00997502
43
[4,] 0.0000000 0.00000000 0.00000000 0.10195551 -0.1197419620 0.0000000
[5,] 0.0000000 0.00000000 0.030735962 0.0000000 -0.0001379529 0.0000000
X18 X19 X20 X21 X22 X23 X24 X25 X26
[1,] 0 0 0.000000000 0.00000000 0.00000000 0 0 0.000000000 0
[2,] 0 0 0.000000000 0.01380068 0.01975871 0 0 0.002415439 0
[3,] 0 0 0.000000000 0.00000000 0.00000000 0 0 0.000000000 0
[4,] 0 0 0.009754919 0.06754525 0.00000000 0 0 0.000000000 0
[5,] 0 0 0.010955780 0.00000000 0.00000000 0 0 0.000000000 0
X27 X28 X29X30X31X32X33 X34
[1,] 0.000000000 0.00000000 0.000000000 0 0 0 0 0.000000000
[2,] 0.003584679 0.00000000 0.003006484 0 0 0 0 0.008540056
[3,] 0.000000000 0.00000000 0.000000000 0 0 0 0 0.000000000
[4,] 0.000000000 -0.03120032 0.000000000 0 0 0 0 0.000000000
[5,] 0.000000000 0.00000000 0.000000000 0 0 0 0 0.000000000
Number of Active Variables:
[1] 25
Selected Variables with Nonzero Coefficients:
[1] "X1" "X2" "X3" "X4" "X5" "X6" "X7" "X8" "X9" "X10" "X11" "X12"
[13] "X13" "X14" "X15" "X16" "X17" "X20" "X21" "X22" "X25" "X27" "X28"
[24] "X29""X34"
>Data2 <- read.csv(file.choose(), header=TRUE)
>z <- Data2[,1:34]
>testingcases <- data.matrix(z, rownames.force = NA)
44
>predict(outlasso, testingcases)
[1] 2 6 2 4 2 2 4 1 1 4 1 1 3 5 4 2 2 3 2 3 5 3 1 3 5 6 5 2 1 4 1 1 4 1 5 6 1
[38] 3 2 4 1 1 4 3 1 4 1 1 6 4 3 2 2 2 3 2 1 4 2 2 1 1 1 5 3 2 4 5 1 5 4 4 1 2
[75] 5 3 3 1 6 1 2 3 5 3 1 2 6 3 5 5 4 4 4 1 1 5 4 5 5 4 3 6 3 5 3 5 1 3 4 2
45
Lampiran IV Output VDA dengan Penalti Ridge
>library(VDA)
> library(csv)
> Data1 <- read.csv(file.choose(), header=TRUE)
> x <- Data1[,1:34]
> y <- Data1[,35]
> lam.vec <- (1:5/100)
> cv <- cv.vda.r(x, y, 10, lam.vec)
> plot(cv)
> out <- vda.r(x,y,cv$lam.opt)
> print(out)
vda.r.default(x, y, cv$lam.opt)
# of cases= 256
# of classes= 6
# of features= 34
Lambda used: 0.05
Estimated Coefficients:
Intercept X1 X2 X3 X4
[1,] 0.048317080 0.0154021996 0.023860034 0.0091651364 0.03032159
[2,] 0.059053854 0.0103046920 0.005643341 -0.0005948195 0.02463950
[3,] 0.041086813 0.0022417345 -0.008999046 0.0074641215 -0.04471942
[4,] 0.050066303 0.0003400156 0.007199094 -0.0132447746 0.00657121
[5,] -0.003517752 0.0055538646 0.017811705 -0.0075759768 0.01358514
X5 X6 X7 X8 X9
[1,] -0.061850195 -1.314841e-02 -0.025179469 -0.006005567 0.0068660976
[2,] 0.023565302 2.841758e-02 -0.001792427 0.015565085 0.0274574902
[3,] 0.055715612 -2.266044e-02 -0.017790070 -0.010362190 0.0196148483
[4,] 0.007580091 -4.504625e-05 0.004415763 0.005053137 -0.0009824064
[5,] 0.023885411 2.469524e-04 0.021096145 0.004229598 0.0297219470
X10 X11 X12 X13 X14
[1,] 0.023061894 -0.0004743558 -0.0070235788 0.018201544 0.050010633
[2,] 0.018326763 0.0013544057 0.0104373530 -0.001236398 0.010694011
[3,] -0.011204591 -0.0156782864 -0.0060489206 -0.011945226 -0.009970055
46
[4,] -0.002837898 -0.0045327850 -0.0026642106 -0.015060531 -0.015956747
[5,] 0.013628843 0.0269397251 -0.0009574318 -0.003186418 0.010307605
X15 X16 X17 X18 X19
[1,] -0.0445645162 0.033509154 0.008127749 0.0146414619 -0.010237049
[2,] -0.0007226326 0.003744774 0.008054338 -0.0032612692 0.011322084
[3,] -0.0489752618 -0.007609370 -0.005522465 -0.0006433701 0.012904860
[4,] 0.0697079735 -0.040636938 0.006558199 -0.0063620726 0.003698420
[5,] -0.0109947840 -0.009283511 0.003496288 -0.0092706400 0.008386666
X20 X21 X22 X23 X24 X25
[1,] 0.01667952 0.00178999 0.02377780 0.01662048 0.00769411 -0.01434075
[2,] 0.02071254 0.02494098 0.02655329 0.00284730 0.02741488 0.02148990
[3,] 0.00292295 -0.01968780 0.0123970 -0.01320346 -0.00342303 -0.01253664
[4,] 0.00522941 0.05449681 0.0105395 0.00636771 0.00889882 -0.00549258
[5,] 0.02670111 0.03239864 0.0183619 0.00624384 0.01418484 -0.00199843
X26 X27 X28 X29 X30
[1,] -0.033724746 -0.013347689 0.03280120 -0.0162197981 -0.017995866
[2,] 0.008522675 0.019418916 -0.02731176 0.0312820734 -0.005938958
[3,] 0.056367844 -0.010367934 0.01196356 -0.0207229158 -0.013521229
[4,] -0.005786788 -0.004824015 -0.08280682 -0.0005302391 -0.010770834
[5,] -0.006027699 -0.001398717 -0.02243921 0.0018906160 0.024792367
X31 X32 X33 X34
[1,] -0.018965457 -0.010022992 -0.001173491 0.007486810
[2,] -0.002372591 -0.005608748 0.023381738 0.008905698
[3,] -0.014548043 0.006034606 -0.040594268 0.001731989
[4,] -0.009831565 0.012972336 0.001596604 0.003793081
[5,] 0.030834228 -0.009531899 -0.007992714 -0.008790583
Predicted classification:
[1] 3 4 1 2 1 5 1 4 3 4 3 1 5 1 2 1 5 5 5 1 5 5 5 6 4 3 3 2 1 1 5 3 4 1 5 1 1
[38] 3 1 5 2 2 4 6 2 1 4 5 1 3 1 1 3 1 4 4 6 6 3 1 4 3 3 4 1 2 6 2 6 2 3 3 3 3
[75] 1 6 2 1 2 1 2 1 3 2 2 1 3 1 1 1 6 3 4 3 1 2 2 1 6 3 4 2 1 5 4 5 5 3 1 5 1
[112] 3 2 1 1 3 2 5 1 2 4 1 1 4 1 1 3 1 5 1 1 2 5 1 6 3 2 3 4 1 3 3 3 4 3 5 2 3
[149] 3 2 5 1 1 4 1 5 1 5 3 1 4 3 1 1 1 3 3 3 5 1 2 2 4 1 3 1 4 3 1 1 5 4 5 1 1
47
[186] 1 4 2 1 4 6 1 1 4 2 1 1 2 5 1 5 4 3 1 1 3 5 3 3 5 6 2 1 4 5 1 6 5 1 2 1 1
[223] 3 1 2 2 1 3 1 4 1 2 1 4 3 2 2 5 3 1 4 4 1 2 1 3 3 4 3 5 5 1 3 1 3 5
Training Error:
[1] 0.0078125
> Data2 <- read.csv(file.choose(), header=TRUE)
> z <- Data2[,1:34]
> testingcases <- data.matrix(z, rownames.force = NA)
> predict(out,testingcases)
[1] 2 6 2 4 2 2 4 1 1 4 1 1 3 5 4 2 2 3 2 3 5 3 1 3 5 6 5 2 1 4 1 1 4 1 5 6 1
[38] 3 2 4 1 1 2 3 1 4 1 1 6 4 3 1 2 2 3 2 1 4 2 2 1 1 1 5 3 2 4 5 1 5 4 2 1 2
[75] 2 3 3 1 6 1 2 3 5 3 1 2 6 3 5 5 4 4 4 1 1 5 4 5 5 2 3 6 3 5 3 5 1 3 4 2
48
Lampiran V Koefisien Fungsi Diskriminan pada Metode VDA dengan PenaltiEuclidean
Kelompok 1 Kelompok 2 Kelompok 3 Kelompok 4 Kelompok 5
Intercept 0.12266913 0.08777305 0.08533676 0.05311611 -0.01104661
X1 0.010188451 -0.007688866 -0.004776176 -0.000190053 0.0080697115
X2 0.05244119 -0.02590249 0.02763146 -0.02041399 0.03135399
X3 7.177107e-06 9.937106e-06 1.376230e-05 5.270494e-08 4.808869e-06
X4 0.01023547 0.02973966 -0.04425702 0.02618457 -0.01275360
X5 -0.02658502 0.04853722 0.07735585 -0.01311966 0.01957577
X6 -0.064363246 0.080318423 -0.059151100 -0.008793252 -0.007115597
X7 -0.10042005 -0.01634381 -0.09882627 -0.02299495 0.07091992
X8 0.000000000 0.066197838 -0.053033956 -0.027167293 0.005809174
X9 0.041267958 0.056895539 0.009591804 0.038405784 0.090291006
X10 0.07325693 0.08444086 0.02251536 0.04044846 0.09730986
X11 -0.006115366 0 -0.000555544 0 0.034079245
X12 -0.003213851 0.045568825 -0.006372379 -0.015943912 -0.002701922
X13 0.011453305 -0.002923342 -0.004655644 -0.003658466 0.000000000
X14 0.05092013 0.03877116 0.00000000 0.00000000 0.02600023
X15 -0.03866981 0.00000000 -0.03272950 0.12004689 -0.02660579
X16 0.013682203 0.002650122 -0.014208656 -0.080449031 -0.038207183
X17 0.0027754047 0.0023514993 -
0.0067719670 0.0047924123 -
0.0005084491
X18 0 0 0 0 0
X19 0.0000000000 0.0037518698 0.0051084362 0.0003263386 0.0024029054
X20 0.000000000 0.010175260 0.000000000 0.013228880 0.009211449
X21 0.000000000 0.024398847 0.002532856 0.072651247 0.030360037
X22 0 0 0 0 0
X23 0 0 0 0 0
X24 0 0 0 0 0
X25 -0.000424541 0.0023149094 -0.000506259 0.0000000000 0.0000000000
X26 -0.018678585 0.000000000 0.009988018 0.000000000 -0.007462407
X27 -0.001872705 0.017442730 -0.002473465 0.000000000 0.000000000
X28 0.013103551 -0.029748003 0.008002987 -0.063685921 -0.013220904
X29 0 0 0 0 0
X30 -0.007436386 -0.002913243 -0.004399203 -0.002636071 0.007111264
X31 0 0 0 0 0
X32 0.000000000 0.009870899 0.003040760 0.014402282 0.000000000
X33 0 0 0 0 0
X34 0.004209829 0.003098623 0.000512731 0.000000000 -0.001162476
49
Lampiran VIKoefisien Fungsi Diskriminan pada Metode VDA dengan Penalti Lasso
Kelompok 1 Kelompok 2 Kelompok 3 Kelompok 4 Kelompok 5
Intercept 0.16557457 0.20784915 0.09822989 0.06395670 0.01246806
X1 0.06920843 -0.01136693 0.00000000 -0.06900479 0.03437746
X2 0.146448540 0.005246624 0.015764372 -0.053347804 0.043376951
X3 -0.03962667 0.19490486 0.00000000 0.00000000 0.00000000
X4 -0.009612442 0.098541864 -0.127490457 0.061684189 -0.02038171
X5 -0.03300337 0.03601689 0.10762828 -0.05195387 0
X6 -0.10558938 0.17174541 -0.05556989 0.00000000 0.00000000
X7 -0.091194291 -0.004677335 -0.098446917 -0.024362969 0.122198434
X8 0.00000000 0.04995914 -0.04277658 -0.03776891 0.00000000
X9 0.042822158 0.092877295 0.003633732 0.024720129 0.100193116
X10 0.06242276 0.07890327 0.04412943 0.04565799 0.09192552
X11 0 0 0 0 0.04310113
X12 0.00000000 0.04040128 0.00000000 0.00000000 0.00000000
X13 0.017379950 0.000000000 -0.000303028 0.000000000 0.000000000
X14 0.088514062 0.009886065 0.000000000 0.000000000 0.030735962
X15 -0.03958132 0.00000000 -0.02872535 0.10195551 0.00000000
X16 0.0000000000 -0.009557029 -0.007626404 -0.119741962 -0.00013795
X17 0 0 -0.00997502 0 0
X18 0 0 0 0 0
X19 0 0 0 0 0
X20 0.000000000 0.000000000 0.000000000 0.009754919 0.010955780
X21 0.00000000 0.01380068 0.00000000 0.06754525 0.00000000
X22 0.00000000 0.01975871 0.00000000 0.00000000 0.00000000
X23 0 0 0 0 0
X24 0 0 0 0 0
X25 0.000000000 0.002415439 0.000000000 0.000000000 0.000000000
X26 0.000000000 0.003584679 0.000000000 0.000000000 0.000000000
X27 0.000000000 0.003584679 0.000000000 0.000000000 0.000000000
X28 0.00000000 0.00000000 0.00000000 -0.03120032 0.00000000
X29 0.000000000 0.003006484 0.000000000 0.000000000 0.000000000
X30 0 0 0 0 0
X31 0 0 0 0 0
X32 0 0 0 0 0
X33 0 0 0 0 0
X34 0.000000000 0.008540056 0.000000000 0.000000000 0.000000000
50
Lampiran VIIKoefisien Fungsi Diskriminan pada Metode VDA dengan Penalti Ridge
Kelompok 1 Kelompok 2 Kelompok 3 Kelompok 4 Kelompok 5
Intercept 0.048317080 0.059053854 0.041086813 0.050066303 -0.003517752
X1 0.0154021996 0.0103046920 0.0022417345 0.0003400156 0.0055538646
X2 0.023860034 0.005643341 -0.008999046 0.007199094 0.017811705
X3 0.0091651364 -0.000594819 0.0074641215 -0.013244774 -0.007575976
X4 0.03032159 0.0246395 -0.04471942 0.00657121 0.01358514
X5 -0.061850195 0.023565302 0.055715612 0.007580091 0.023885411
X6 -1.31484e-02 2.841758e-02 -2.266044e-02 -4.50462e-05 2.469524e-04
X7 -0.025179469 -0.001792427 -0.017790070 0.004415763 0.021096145
X8 -0.006005567 0.015565085 -0.010362190 0.005053137 0.004229598
X9 0.006866098 0.02745749 0.019614848 -0.000982406 0.029721947
X10 0.023061894 0.018326763 -0.011204591 -0.002837898 0.013628843
X11 -0.000474355 0.0013544057 -0.015678286 -0.004532785 0.0269397251
X12 -0.007023578 0.010437353 -0.006048920 -0.002664210 -0.000957431
X13 0.018201544 -0.001236398 -0.011945226 -0.015060531 -0.003186418
X14 0.050010633 0.010694011 -0.009970055 -0.015956747 0.010307605
X15 -0.044564516 -0.000722632 -0.048975261 0.0697079735 -0.010994784
X16 0.033509154 0.003744774 -0.007609370 -0.040636938 -0.009283511
X17 0.008127749 0.008054338 -0.005522465 0.006558199 0.003496288
X18 0.0146414619 -0.003261269 -0.000643370 -0.006362072 -0.009270640
X19 -0.010237049 0.011322084 0.01290486 0.00369842 0.008386666
X20 0.016679523 0.020712547 0.002922951 0.005229410 0.026701118
X21 0.001789998 0.024940981 -0.019687808 0.054496810 0.032398642
X22 0.02377780 0.02655329 0.01239704 0.01053949 0.01836191
X23 0.016620488 0.002847304 -0.013203464 0.006367708 0.006243845
X24 0.007694119 0.027414885 -0.003423036 0.008898816 0.014184849
X25 -0.01434075 0.021489904 -0.012536641 -0.005492586 -0.001998431
X26 -0.033724746 0.008522675 0.056367844 -0.005786788 -0.006027699
X27 -0.013347689 0.019418916 -0.010367934 -0.004824015 -0.001398717
X28 0.03280120 -0.02731176 0.01196356 -0.08280682 -0.02243921
X29 -0.016219798 0.0312820734 -0.020722915 -0.000530239 0.001890616
X30 -0.017995866 -0.005938958 -0.013521229 -0.010770834 0.024792367
X31 -0.018965457 -0.002372591 -0.014548043 -0.009831565 0.030834228
X32 -0.010022992 -0.005608748 0.006034606 0.012972336 -0.009531899
X33 -0.001173491 0.023381738 -0.040594268 0.001596604 -0.007992714
X34 0.007486810 0.008905698 0.001731989 0.003793081 -0.008790583
Top Related