03 Ashadi S. Absensi
-
Upload
cicik-dian-pratywi -
Category
Documents
-
view
221 -
download
0
Transcript of 03 Ashadi S. Absensi
-
7/26/2019 03 Ashadi S. Absensi
1/10
Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 25
RANCANGAN PROGRAM APLIKASIPENGENALAN POLA SUARA PADA ABSENSI KARYAWANMENGGUNAKAN GAUSSIAN MIXTURE MODEL DAN MABC
Djunaidy Santoso 1; Genbit Yasbil 2; Ashadi Salim 3
ABSTRACT
The problem that some companies faced was making the employee attendance be unique,efficient, and suitable, especially from security and cost aspect. Therefore, the speech recognition thatapplied to employee attendance was suitable to be implemented. The quality of digital speech in thiscase was a conversation recorded in file wav format, will influence digital communication. Morenoises existing in the file wav data causes accuracy and time for processing will be more difficult. Theimplementation of this program to employee attendance of M.R companies showed that thisapplication program was successful by giving the accuracy optimation and data resolution fromspeech records, with level recognition 58.3%, and accuracy more than 90%.
Keywords: speach recognition, gaussian mixture model, attendance, digital speach signal
ABSTRAK
Masalah yang dihadapi beberapa perusahaan saat ini adalah membuat absensi dengankarakter unik secara efisien dan tepat, terutama ditinjau dari segi keamanan dan biaya. Aplikasi
pengenalan suara yang digunakan untuk absensi merupakan aplikasi yang tepat untukdiimplementasikan pada suatu perusahaan. Kualitas suara digital dalam menyampaikan pesan, dalamhal ini berupa rekaman percakapan dalam format file wav akan mempengaruhi kualitas komunikasidigital. Banyaknya bunyi lain selain suara pembicara, yang ikut terekam menjadi noise bagi suarautama. Implementasi program pada absensi karyawan perusahaan PT M.R. menunjukkan bahwa
program aplikasi ini berhasil dengan baik, dengan memberikan optimasi ketepatan dan kejelasan datadari suara yang direkam dengan tingkat pengenalan rata-rata 58.3% dan keakuratan lebih dari 90%.
Kata kunci: pengenalan suara, gaussian mixture model, absensi, sinyal suara digital
1 Jurusan Teknik Informatika, FASILKOM, Universitas Bina Nusantara, Kampus Syahdan No. 9,Palmerah, Jakarta Barat 114802, 3 Jurusan Matematika, FMIPA, Universitas Bina Nusantara, Kampus Anggrek, Jln. Kebon Jeruk RayaNo. 27, Kebon Jeruk Jakarta Barat 11530, [email protected]
-
7/26/2019 03 Ashadi S. Absensi
2/10
Jurnal M t S t t , Vol. 8 No. 1, Januari 2008: 25-34 26
PENDAHULUAN
Masalah yang dihadapi beberapa perusahaan saat ini adalah membuat absensi dengan karakterunik secara efisien dan tepat, terutama ditinjau dari segi keamanan dan biaya. Kemajuan teknologiinformasi sat ini, baik dari sisi hardware maupun software , telah banyak digunakan dalam analisisdigital komunikasi maka aplikasi pengenalan suara yang digunakan untuk absensi merupakan aplikasiyang tepat untuk diimplementasikan pada suatu perusahaan.
Kualitas suara digital dalam menyampaikan pesan ataupun kejelasan kata pembicara adalah penting dan berpengaruh terhadap kualitas pada komunikasi digital. Suara digital yang dimaksudadalah rekaman percakapan dalam format file wav yang digunakan sebagai absensi karyawan suatu
perusahaan. Banyaknya bunyi lain, selain suara pembicara yang ikut terekam menjadi noise bagi suarautamanya. Misalnya, suara angin, bunyi klakson, suara orang lain yang berada dekat pembicara, dan
bunyi lainnya yang ikut terekam. Semakin banyak noise yang terdapat pada data wav maka ketepatandan waktu pemrosesannya semakin terhambat.
Program aplikasi ini dibuat untuk mengurangi noise yang terekam dalam bentuk file wav. danmengekstrak klasifikasi data wav yang digunakan sebagai master file wav. untuk pengenalan suaradigital dan pada proses perekaman langsung pengenalan suara. Untuk menghilangkan noise pada suaradigital, dilakukan dengan dua tahap. Pertama, pemisahan suara utama dengan noise . Kedua, dilakukansampling dari suara utama. Dengan menggabungkan gaussian mixture model, teknik sampling
fundamental frekuensi MABC ( Moving Average and Band-Limitation IN Cepstrum) , diharapkan program aplikasi ini dapat memberikan optimasi ketepatan dan kejelasan data dari suara yang direkam.
Kelemahan metode pengenalan menggunakan klasifikasi probabilitas dari data suara, sepertimenggunakan Gaussian mixture model adalah apabila data yang akan dikenali terdapat noise . Jenisnoise yang paling sukar untuk dikenali maupun dihilangkan adalah white noise , yaitu noise dasaryang terdapat pada perekaman karena adanya kontak listrik digital pada hardware dan koneksi alatyang kurang baik. Pengenalan objek dengan memanfaatkan objek suara manusia memiliki kelemahanutama, selain kondisi saat perekaman, juga karena kondisi suara dari objek tersebut yang sering
berubah, seperti intonasi, nada suara, dan volume suara seseorang yang tidak konstan. Namun, hal itudapat diatasi dengan metode MABC yang mengambil frekuensi dasar dengan mendekati persamaantersebut.
Perancangan program aplikasi untuk menghilangkan noise suara digital ini dibatasi dalamruang lingkup seperti berikut: Jenis data file Audio yang diedit adalah dalam format Windows Wave
form 16bit stereo 44.1 Khz, WAV (windows audio format), serta hanya menerapkan Gaussianmixture model dan proses sampling fundamental frequency dengan MABC( Moving Average and Band-limitation in Cepstrum method ). Pada rancangan ini, file data audio yang dapat diolah dandisimpan berupa format file wav. Program dibuat dengan bahasa pemrograman Borland Delphi 6.0,Matlab V.7 R.13, dan sistem database SQL Server 2000.
GAUSSIANN MIXTURE MODEL (GMM)
Gaussian mixture model adalah suatu himpunan komponen model fungsi kerapatan yangdapat menghitung dan melacak ruas suatu model spektrum. Mixture model juga merupakan metodeyang efektif untuk perubahan dari model yang bergerak lambat karena merupakan semi parameteralternatif untuk histogram tanpa parameter dan memberikan fleksibilitas lebih serta ketelitian dalammemodelkan statistik dari data, dengan kata lain untuk mevisualkan suatu dynamic scene .
-
7/26/2019 03 Ashadi S. Absensi
3/10
Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 27
GMM juga merupakan model statistik dari distibusi probabilitas yang didapatkan dari nilai bobot setiap distribusi Gaussian sehingga GMM merupakan metode yang sangat tepat untuk
perhitungan, baik dengan parameter maupun tidak. Bila model telah dihasilkan, syarat peluang dapatdihitung dan GMM juga dapat ditampilkan sebagai bentuk fungsi hubungan dasar network, seperti berikut ini (Paalanen, et. al., 2005).
Generative model:
Dengan nilai distribusi D dimensi dari variabel acak :
Keterangan:x = nilai posisi x ; y = Y fungsi xexp[n] = e n ; D = dimensi matrik = matrik kovarians ; = vektor rata-rataT = jumlah komponen
Kemungkinan untuk (y 1,,y n) adalah sebagai berikut.
Estimasi:
Nilai yang diharapkan:
Nilai maksimum:
Sampling Fundamental Frekuensi dengan MABC
Fundamental frequency F0 merupakan parameter dasar dalam ilmu akustik, khususnya padateknologi pengolahan sinyal suara (Fryantoni, 2004). Seperti pada speech recognition maupun speechsynthesis , fundamental frequency merupakan salah satu parameter penting, di samping parameterlainnya yang memberikan informasi mengenai suatu domain frekuensi (Dubnov, et. al., 2003).
Proses sampling dengan cara Moving Average and Band-limitation in Cepstrum method (MABC) ini akan menghilangkan masalah tidak teraturnya nilai pada domain frequency tinggi yangsering terjadi. Selain itu, pada penelitian speech synthesis , fundamental frequency juga berperansebagai parameter yang dapat meningkatkan kealamian suara, dengan melakukan pengontrolanhubungan penerimaan irama suara ke dalam suatu kalimat.
-
7/26/2019 03 Ashadi S. Absensi
4/10
Jurnal M t S t t , Vol. 8 No. 1, Januari 2008: 25-34 28
Algoritma Proses Sampling Fundamental Frequency MABC
Algoritma proses sampling fundamental frequency menggunakan MABC, ditunjukkan padaGambar 1. Dari gambar 1, pertama-tama dilakukan proses time window dan diferensial orde pertama.Lalu, dengan fourier transform dapat ditentukan inverse power spectral .(Fryantoni, 2004). Dengan inverse fourier transform pada diferensial log power spectral , dapat ditentukan cepstrum yangmerupakan plot atau garis pergerakan tingkat kuasa frekuensi signal, dan dari salah satu bagian high
frequency pada cepstrum yang didapat, ditentukan pick-nya, guna menghitung fundamental frequency .
Analisis Database
Program Database yang digunakan adalah SQL server 2000, dengan metode client-server yang terintegrasi dengan component ADO pada Delphi. Pada program aplikasi ini, dibutuhkan 3 tabel
pada database , yaitu tabel karywan, tabel sound, dan tabel absen, seperti pada Gambar 1 (Alam,
2005).
Gambar 1 Algoritma Proses Sampling Fundamental Frequncy MABC
Tabel Karyawan
Dengan atribut id sebagai field nomor induk dari karyawan, nama sebagai field namalengkap karyawan, Alamat, dan Tgl_lahir (Tabel 1).
Tabel 1 Database Karyawan
Attribut Tipe UkuranID Nchar 6
Nama Varchar 16Alamat Varchar 50
Tgl_Lahir datetime 8
-
7/26/2019 03 Ashadi S. Absensi
5/10
Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 29
Tabel Sound
Dengan atribut id sebagai field nomor induk dari karyawan, rec1,rec2,dan rec3 sebagaifield bulan rekaman 0=belum 1=sudah (Tabel 2).
Tabel 2 Database Sound
Attribut Tipe UkuranID Nchar 1
Rec1 Bit 1Rec2 Bit 1Rec3 bit 1
Tabel Absen
Dengan atribut tgl sebagai field tanggal absensi, id sebagai field nomor induk karyawan,masuk field text data jam absensi masuk, dan keluar field text data jam absensi keluar (Tabel 3 danGambar 2).
Tabel 3 Database Absen
Attribut Tipe UkuranTgl datetime 8ID Nchar 6
Masuk Smalldatetime 4keluar Smalldatetime 4
Gambar 2 Database Relation Diagram
-
7/26/2019 03 Ashadi S. Absensi
6/10
-
7/26/2019 03 Ashadi S. Absensi
7/10
Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 31
Gambar 4 Algoritma Proses Pengenalan Suara
HASIL RANCANGAN PROGRAM
Sarana yang dibutuhkan untuk mengoperasikan program aplikasi absensi suara ini dapatdibagi menjadi dua kelompok. Pertama, spesifikasi kebutuhan perangkat keras. Spesifikasi minimum
perangkat keras untuk client SQL dan absensi adalah sebagai berikut: Processor minimum pentium III,AMD Athlon; Memory dengan kapasitas 256 MB, Monitor SVGA, Mouse dan Keyboard; Harddiskdengan free space 400 MB, Video Card 1 MB, Sound Card, Lan Card Ti & Microphone.
Kedua, spesifikasi kebutuhan perangkat lunak. Untuk mengoperasikan aplikasi pengenal suaradan pemisah noise yang telah dibuat, diperlukan perangkat lunak yang mendukung agar aplikasi ini
berjalan dengan optimal. Spesifikasi minimum perangkat lunak yang dibutuhkan untuk aplikasi iniadalah sebagai berikut: Sistem operasi Microsoft Windows 9x, XP atau NT Server; SQL Server 2000;Perangkat lunak program aplikasi pemisah noise dan absensi dengan ukuran 60 MB diutamakanmodul database; Matlab Runtime v.7 r.13.
Evaluasi Program Apikasi
Evaluasi program aplikasi ini dilakukan dengan dua cara, yaitu run and trial proses kalkulasi probabilitas pengenalan suara setelah pemisahan noise dengan Matlab, dan percobaan penggunaan program aplikasi secara keseluruhan pada karyawan perusahaan PT M.R.
Evaluasi Proses Kalkulasi
Pada evaluasi proses kalkulasi, dilakukan eksperimen dengan file m pada matlab yang telahdibuat, untuk mengetahui berapa besar persentase dari hasil pengenalan suara yang tepat, dan berapa
besar tingkat intensitas pengenalannya. Untuk itu, dilakukan pengumpulan sampel suara pada file wav.
-
7/26/2019 03 Ashadi S. Absensi
8/10
Jurnal M t S t t , Vol. 8 No. 1, Januari 2008: 25-34 32
dengan format 16bit stereo 44.1 KBps. Dengan 4 sumber objek yang masing-masing direkamsebanyak tiga kali sehingga didapatkan file wav. sejumlah 12 file dengan rata-rata durasi sampling
yang diambil berkisar antara 2.75 detik sampai 3 detik.
Data sampling tersebut diklasifikasikan menurut sumber sampel sebanyak 4 klasifikasi yangdiberi nama A ,B ,C, dan D sehingga didapatkan 12 sampel, yaitu {A1, A2, A3, B1, B2, B3, C1, C2,C3, D1, D2, D3}. Setelah data sampel tersedia, dilakukan sampling dengan metode MABC. Setelah
proses MABC, setiap data menjadi 50 array yang berisi tingkat intensitas frekuensi dan nilai yangdibutuhkan untuk per satu gelombang yang disebut power frekuensi. Dipilih setiap class dengannomor 1 sebagai master file wave, dengan GMM matlab unit gmmbcreate.m untuk mencarikomponen bobot dari array dan fungsi GMM-nya (Gambar 5).
Gambar 5 Algoritma GMM
Nilai gmmclass digunakan untuk menentukan tingkat ketepatan probabilitas per layer darisampel suara yang ada dengan nomor 2 dan 3 dengan gmmb_classify.m. Algoritma GMM inimampu menentukan derajat dan posisi dari data yang tidak sesuai dengan data master wave. Data yangtidak sesuai dihapus dengan cara mengembalikan array pada nilai awal yang berarti nol. Pada tahapinilah, jika ingin dilakukan pengembalian data wave ke file suara maka posisi yang kosong harusdigantikan dengan posisi dari file master sehingga tidak ada jedah suara senyap pada file suara(Gambar 6).
-
7/26/2019 03 Ashadi S. Absensi
9/10
Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 33
Gambar 6 Plot Penyebaran Data (yang Dilingkar adalah yang Tidak Sesuai)
Data Array yang telah dipisahkan noise -nya, dicocokkan dengan file master untuk mengetahui besarnya tingkat pengenalan suara, hasilnya dapat dilihat pada Tabel 4.
Tabel 4 Hasil Evaluasi Pengenalan Suara
Dari Tabel 4, terlihat hasil proses pengenalan suara yang dilakukan dengan 4 jenis objek dan 3sampel per objek. Setelah dilakukan 16 kali proses pengenalan, dapat dilihat untuk pengenalan suaradengan objek yang sama (A2 dan A3 dengan A1; B2 dan B3 dengan B1; C2 dan C3 dengan C1; D2 dan D3 dengan D1) rata-rata sebesar 58.3% dan akurasi pengenalan suara lebih dari 90%.
PENUTUP
Dari analisis terhadap hasil program aplikasi, dapat diambil beberapa simpulan sebagai berikut. Adanya noise pada file wav. yang direkam mempengaruhi besarnya persentase pengenalansuara sehinga semakin banyak noise yang ada maka semakin berkurang tingkat pengenalannya. Di sisilain, setiap perekaman maupun pengubahan dari data yang terkontaminasi noise , membutuhkan datadasar yang dijadikan sebagai pedoman untuk mengklasifikasikan data dan memprosesnya. Pemisahanmaupun penghilangan noise dari data dapat berpeluang besar untuk menciptakan noise baru yang
berpotensi lebih kecil maupun lebih besar terdapat dalam data.
Adapun dengan pemisahan noise , nilai data yang terdapat pada record tempat noise beradadapat dinormalisasikan. Namun, pada pengenalan suara tetap akan berkurang tingkat akurasinyakarena hilangnya nilai node kontinu pada record . Pada percobaan dan analisis pada evaluasi proseskalkulasi, rata-rata didapatkan pengenalan suara pada tingkat persentase 58.3% yang mungkindisebabkan oleh hal tersebut, walaupun tidak sampai 80% namun pengenalan suara dapat dikatakan
berhasil dengan akurasi lebih dari 90%.
A2 A3 B2 B3 C2 C3 D2 D3
A1 0.5149 0.5576 0.3314 0.4384 0.2901 0.2295 0.3517 0.2951
B1 0.3845 0.3167 0.4602 0.5133 0.3115 0.2861 0.3820 0.3945
C1 0.2901 0.2261 0.2107 0.2189 0.4885 0.6133 0.3122 0.3512D1 0.3360 0.3127 0.4401 0.4868 0.3819 0.3946 0.7354 0.7819
-
7/26/2019 03 Ashadi S. Absensi
10/10
J l M S V l 8 N 1 J i 2008 25 3434
DAFTAR PUSTAKA
Alam, Agus J. 2005. Pemrograman Database Borland Delphi dalam SQL Server 7.0 & 2005. Jakarta:PT Elex Media Komputindo.
Dubnov, Sholomo and Adiel Ben-Shalom. 2003. Review of ICA and HOS Methods for Retrieval of Natural Sounds and Sound Effects . Nara, Japan. April 2003. 4th International Symposium onIndependent Component Analysis and Blind Signal Separation (ICA2003).http://music.ucsd.edu/~sdubnov/Papers/ReviewICA03.pdf
Fryantoni, Driszal. 2004. Proses Sampling Fundamental Frequency dengan MABC. Diakses darihttp://www.informatika.lipi.go.id/jurnal/proses-sampling-fundamental-frequency-dengan-mabc/
Kmrinen, Joni dan Pekka Paalanen. 2003. GMMBAYES - Bayesian Classifier and GaussianMixture Model ToolBox. Lappeenranta University of Technology. Diakses darihttp://www.it.lut.fi/project/gmmbayes/
Paalanen, P., J.K. Kamarainen, J. Ilonen, and H. Klviinen, 2005. Feature Representation andDiscrimination Based on Gaussian Mixture Model Probability Densities - Practices andAlgorithms. Research Report 95, Lappeenranta University of Technology, Department ofInformation Technology, Diakses darihttp://www.it.lut.fi/project/gmmbayes/downloads/doc/laitosrap95.pdf