03 Ashadi S. Absensi

download 03 Ashadi S. Absensi

of 10

Transcript of 03 Ashadi S. Absensi

  • 7/26/2019 03 Ashadi S. Absensi

    1/10

    Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 25

    RANCANGAN PROGRAM APLIKASIPENGENALAN POLA SUARA PADA ABSENSI KARYAWANMENGGUNAKAN GAUSSIAN MIXTURE MODEL DAN MABC

    Djunaidy Santoso 1; Genbit Yasbil 2; Ashadi Salim 3

    ABSTRACT

    The problem that some companies faced was making the employee attendance be unique,efficient, and suitable, especially from security and cost aspect. Therefore, the speech recognition thatapplied to employee attendance was suitable to be implemented. The quality of digital speech in thiscase was a conversation recorded in file wav format, will influence digital communication. Morenoises existing in the file wav data causes accuracy and time for processing will be more difficult. Theimplementation of this program to employee attendance of M.R companies showed that thisapplication program was successful by giving the accuracy optimation and data resolution fromspeech records, with level recognition 58.3%, and accuracy more than 90%.

    Keywords: speach recognition, gaussian mixture model, attendance, digital speach signal

    ABSTRAK

    Masalah yang dihadapi beberapa perusahaan saat ini adalah membuat absensi dengankarakter unik secara efisien dan tepat, terutama ditinjau dari segi keamanan dan biaya. Aplikasi

    pengenalan suara yang digunakan untuk absensi merupakan aplikasi yang tepat untukdiimplementasikan pada suatu perusahaan. Kualitas suara digital dalam menyampaikan pesan, dalamhal ini berupa rekaman percakapan dalam format file wav akan mempengaruhi kualitas komunikasidigital. Banyaknya bunyi lain selain suara pembicara, yang ikut terekam menjadi noise bagi suarautama. Implementasi program pada absensi karyawan perusahaan PT M.R. menunjukkan bahwa

    program aplikasi ini berhasil dengan baik, dengan memberikan optimasi ketepatan dan kejelasan datadari suara yang direkam dengan tingkat pengenalan rata-rata 58.3% dan keakuratan lebih dari 90%.

    Kata kunci: pengenalan suara, gaussian mixture model, absensi, sinyal suara digital

    1 Jurusan Teknik Informatika, FASILKOM, Universitas Bina Nusantara, Kampus Syahdan No. 9,Palmerah, Jakarta Barat 114802, 3 Jurusan Matematika, FMIPA, Universitas Bina Nusantara, Kampus Anggrek, Jln. Kebon Jeruk RayaNo. 27, Kebon Jeruk Jakarta Barat 11530, [email protected]

  • 7/26/2019 03 Ashadi S. Absensi

    2/10

    Jurnal M t S t t , Vol. 8 No. 1, Januari 2008: 25-34 26

    PENDAHULUAN

    Masalah yang dihadapi beberapa perusahaan saat ini adalah membuat absensi dengan karakterunik secara efisien dan tepat, terutama ditinjau dari segi keamanan dan biaya. Kemajuan teknologiinformasi sat ini, baik dari sisi hardware maupun software , telah banyak digunakan dalam analisisdigital komunikasi maka aplikasi pengenalan suara yang digunakan untuk absensi merupakan aplikasiyang tepat untuk diimplementasikan pada suatu perusahaan.

    Kualitas suara digital dalam menyampaikan pesan ataupun kejelasan kata pembicara adalah penting dan berpengaruh terhadap kualitas pada komunikasi digital. Suara digital yang dimaksudadalah rekaman percakapan dalam format file wav yang digunakan sebagai absensi karyawan suatu

    perusahaan. Banyaknya bunyi lain, selain suara pembicara yang ikut terekam menjadi noise bagi suarautamanya. Misalnya, suara angin, bunyi klakson, suara orang lain yang berada dekat pembicara, dan

    bunyi lainnya yang ikut terekam. Semakin banyak noise yang terdapat pada data wav maka ketepatandan waktu pemrosesannya semakin terhambat.

    Program aplikasi ini dibuat untuk mengurangi noise yang terekam dalam bentuk file wav. danmengekstrak klasifikasi data wav yang digunakan sebagai master file wav. untuk pengenalan suaradigital dan pada proses perekaman langsung pengenalan suara. Untuk menghilangkan noise pada suaradigital, dilakukan dengan dua tahap. Pertama, pemisahan suara utama dengan noise . Kedua, dilakukansampling dari suara utama. Dengan menggabungkan gaussian mixture model, teknik sampling

    fundamental frekuensi MABC ( Moving Average and Band-Limitation IN Cepstrum) , diharapkan program aplikasi ini dapat memberikan optimasi ketepatan dan kejelasan data dari suara yang direkam.

    Kelemahan metode pengenalan menggunakan klasifikasi probabilitas dari data suara, sepertimenggunakan Gaussian mixture model adalah apabila data yang akan dikenali terdapat noise . Jenisnoise yang paling sukar untuk dikenali maupun dihilangkan adalah white noise , yaitu noise dasaryang terdapat pada perekaman karena adanya kontak listrik digital pada hardware dan koneksi alatyang kurang baik. Pengenalan objek dengan memanfaatkan objek suara manusia memiliki kelemahanutama, selain kondisi saat perekaman, juga karena kondisi suara dari objek tersebut yang sering

    berubah, seperti intonasi, nada suara, dan volume suara seseorang yang tidak konstan. Namun, hal itudapat diatasi dengan metode MABC yang mengambil frekuensi dasar dengan mendekati persamaantersebut.

    Perancangan program aplikasi untuk menghilangkan noise suara digital ini dibatasi dalamruang lingkup seperti berikut: Jenis data file Audio yang diedit adalah dalam format Windows Wave

    form 16bit stereo 44.1 Khz, WAV (windows audio format), serta hanya menerapkan Gaussianmixture model dan proses sampling fundamental frequency dengan MABC( Moving Average and Band-limitation in Cepstrum method ). Pada rancangan ini, file data audio yang dapat diolah dandisimpan berupa format file wav. Program dibuat dengan bahasa pemrograman Borland Delphi 6.0,Matlab V.7 R.13, dan sistem database SQL Server 2000.

    GAUSSIANN MIXTURE MODEL (GMM)

    Gaussian mixture model adalah suatu himpunan komponen model fungsi kerapatan yangdapat menghitung dan melacak ruas suatu model spektrum. Mixture model juga merupakan metodeyang efektif untuk perubahan dari model yang bergerak lambat karena merupakan semi parameteralternatif untuk histogram tanpa parameter dan memberikan fleksibilitas lebih serta ketelitian dalammemodelkan statistik dari data, dengan kata lain untuk mevisualkan suatu dynamic scene .

  • 7/26/2019 03 Ashadi S. Absensi

    3/10

    Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 27

    GMM juga merupakan model statistik dari distibusi probabilitas yang didapatkan dari nilai bobot setiap distribusi Gaussian sehingga GMM merupakan metode yang sangat tepat untuk

    perhitungan, baik dengan parameter maupun tidak. Bila model telah dihasilkan, syarat peluang dapatdihitung dan GMM juga dapat ditampilkan sebagai bentuk fungsi hubungan dasar network, seperti berikut ini (Paalanen, et. al., 2005).

    Generative model:

    Dengan nilai distribusi D dimensi dari variabel acak :

    Keterangan:x = nilai posisi x ; y = Y fungsi xexp[n] = e n ; D = dimensi matrik = matrik kovarians ; = vektor rata-rataT = jumlah komponen

    Kemungkinan untuk (y 1,,y n) adalah sebagai berikut.

    Estimasi:

    Nilai yang diharapkan:

    Nilai maksimum:

    Sampling Fundamental Frekuensi dengan MABC

    Fundamental frequency F0 merupakan parameter dasar dalam ilmu akustik, khususnya padateknologi pengolahan sinyal suara (Fryantoni, 2004). Seperti pada speech recognition maupun speechsynthesis , fundamental frequency merupakan salah satu parameter penting, di samping parameterlainnya yang memberikan informasi mengenai suatu domain frekuensi (Dubnov, et. al., 2003).

    Proses sampling dengan cara Moving Average and Band-limitation in Cepstrum method (MABC) ini akan menghilangkan masalah tidak teraturnya nilai pada domain frequency tinggi yangsering terjadi. Selain itu, pada penelitian speech synthesis , fundamental frequency juga berperansebagai parameter yang dapat meningkatkan kealamian suara, dengan melakukan pengontrolanhubungan penerimaan irama suara ke dalam suatu kalimat.

  • 7/26/2019 03 Ashadi S. Absensi

    4/10

    Jurnal M t S t t , Vol. 8 No. 1, Januari 2008: 25-34 28

    Algoritma Proses Sampling Fundamental Frequency MABC

    Algoritma proses sampling fundamental frequency menggunakan MABC, ditunjukkan padaGambar 1. Dari gambar 1, pertama-tama dilakukan proses time window dan diferensial orde pertama.Lalu, dengan fourier transform dapat ditentukan inverse power spectral .(Fryantoni, 2004). Dengan inverse fourier transform pada diferensial log power spectral , dapat ditentukan cepstrum yangmerupakan plot atau garis pergerakan tingkat kuasa frekuensi signal, dan dari salah satu bagian high

    frequency pada cepstrum yang didapat, ditentukan pick-nya, guna menghitung fundamental frequency .

    Analisis Database

    Program Database yang digunakan adalah SQL server 2000, dengan metode client-server yang terintegrasi dengan component ADO pada Delphi. Pada program aplikasi ini, dibutuhkan 3 tabel

    pada database , yaitu tabel karywan, tabel sound, dan tabel absen, seperti pada Gambar 1 (Alam,

    2005).

    Gambar 1 Algoritma Proses Sampling Fundamental Frequncy MABC

    Tabel Karyawan

    Dengan atribut id sebagai field nomor induk dari karyawan, nama sebagai field namalengkap karyawan, Alamat, dan Tgl_lahir (Tabel 1).

    Tabel 1 Database Karyawan

    Attribut Tipe UkuranID Nchar 6

    Nama Varchar 16Alamat Varchar 50

    Tgl_Lahir datetime 8

  • 7/26/2019 03 Ashadi S. Absensi

    5/10

    Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 29

    Tabel Sound

    Dengan atribut id sebagai field nomor induk dari karyawan, rec1,rec2,dan rec3 sebagaifield bulan rekaman 0=belum 1=sudah (Tabel 2).

    Tabel 2 Database Sound

    Attribut Tipe UkuranID Nchar 1

    Rec1 Bit 1Rec2 Bit 1Rec3 bit 1

    Tabel Absen

    Dengan atribut tgl sebagai field tanggal absensi, id sebagai field nomor induk karyawan,masuk field text data jam absensi masuk, dan keluar field text data jam absensi keluar (Tabel 3 danGambar 2).

    Tabel 3 Database Absen

    Attribut Tipe UkuranTgl datetime 8ID Nchar 6

    Masuk Smalldatetime 4keluar Smalldatetime 4

    Gambar 2 Database Relation Diagram

  • 7/26/2019 03 Ashadi S. Absensi

    6/10

  • 7/26/2019 03 Ashadi S. Absensi

    7/10

    Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 31

    Gambar 4 Algoritma Proses Pengenalan Suara

    HASIL RANCANGAN PROGRAM

    Sarana yang dibutuhkan untuk mengoperasikan program aplikasi absensi suara ini dapatdibagi menjadi dua kelompok. Pertama, spesifikasi kebutuhan perangkat keras. Spesifikasi minimum

    perangkat keras untuk client SQL dan absensi adalah sebagai berikut: Processor minimum pentium III,AMD Athlon; Memory dengan kapasitas 256 MB, Monitor SVGA, Mouse dan Keyboard; Harddiskdengan free space 400 MB, Video Card 1 MB, Sound Card, Lan Card Ti & Microphone.

    Kedua, spesifikasi kebutuhan perangkat lunak. Untuk mengoperasikan aplikasi pengenal suaradan pemisah noise yang telah dibuat, diperlukan perangkat lunak yang mendukung agar aplikasi ini

    berjalan dengan optimal. Spesifikasi minimum perangkat lunak yang dibutuhkan untuk aplikasi iniadalah sebagai berikut: Sistem operasi Microsoft Windows 9x, XP atau NT Server; SQL Server 2000;Perangkat lunak program aplikasi pemisah noise dan absensi dengan ukuran 60 MB diutamakanmodul database; Matlab Runtime v.7 r.13.

    Evaluasi Program Apikasi

    Evaluasi program aplikasi ini dilakukan dengan dua cara, yaitu run and trial proses kalkulasi probabilitas pengenalan suara setelah pemisahan noise dengan Matlab, dan percobaan penggunaan program aplikasi secara keseluruhan pada karyawan perusahaan PT M.R.

    Evaluasi Proses Kalkulasi

    Pada evaluasi proses kalkulasi, dilakukan eksperimen dengan file m pada matlab yang telahdibuat, untuk mengetahui berapa besar persentase dari hasil pengenalan suara yang tepat, dan berapa

    besar tingkat intensitas pengenalannya. Untuk itu, dilakukan pengumpulan sampel suara pada file wav.

  • 7/26/2019 03 Ashadi S. Absensi

    8/10

    Jurnal M t S t t , Vol. 8 No. 1, Januari 2008: 25-34 32

    dengan format 16bit stereo 44.1 KBps. Dengan 4 sumber objek yang masing-masing direkamsebanyak tiga kali sehingga didapatkan file wav. sejumlah 12 file dengan rata-rata durasi sampling

    yang diambil berkisar antara 2.75 detik sampai 3 detik.

    Data sampling tersebut diklasifikasikan menurut sumber sampel sebanyak 4 klasifikasi yangdiberi nama A ,B ,C, dan D sehingga didapatkan 12 sampel, yaitu {A1, A2, A3, B1, B2, B3, C1, C2,C3, D1, D2, D3}. Setelah data sampel tersedia, dilakukan sampling dengan metode MABC. Setelah

    proses MABC, setiap data menjadi 50 array yang berisi tingkat intensitas frekuensi dan nilai yangdibutuhkan untuk per satu gelombang yang disebut power frekuensi. Dipilih setiap class dengannomor 1 sebagai master file wave, dengan GMM matlab unit gmmbcreate.m untuk mencarikomponen bobot dari array dan fungsi GMM-nya (Gambar 5).

    Gambar 5 Algoritma GMM

    Nilai gmmclass digunakan untuk menentukan tingkat ketepatan probabilitas per layer darisampel suara yang ada dengan nomor 2 dan 3 dengan gmmb_classify.m. Algoritma GMM inimampu menentukan derajat dan posisi dari data yang tidak sesuai dengan data master wave. Data yangtidak sesuai dihapus dengan cara mengembalikan array pada nilai awal yang berarti nol. Pada tahapinilah, jika ingin dilakukan pengembalian data wave ke file suara maka posisi yang kosong harusdigantikan dengan posisi dari file master sehingga tidak ada jedah suara senyap pada file suara(Gambar 6).

  • 7/26/2019 03 Ashadi S. Absensi

    9/10

    Rancangan Program Aplikasi (Djunaidy Santoso; dkk) 33

    Gambar 6 Plot Penyebaran Data (yang Dilingkar adalah yang Tidak Sesuai)

    Data Array yang telah dipisahkan noise -nya, dicocokkan dengan file master untuk mengetahui besarnya tingkat pengenalan suara, hasilnya dapat dilihat pada Tabel 4.

    Tabel 4 Hasil Evaluasi Pengenalan Suara

    Dari Tabel 4, terlihat hasil proses pengenalan suara yang dilakukan dengan 4 jenis objek dan 3sampel per objek. Setelah dilakukan 16 kali proses pengenalan, dapat dilihat untuk pengenalan suaradengan objek yang sama (A2 dan A3 dengan A1; B2 dan B3 dengan B1; C2 dan C3 dengan C1; D2 dan D3 dengan D1) rata-rata sebesar 58.3% dan akurasi pengenalan suara lebih dari 90%.

    PENUTUP

    Dari analisis terhadap hasil program aplikasi, dapat diambil beberapa simpulan sebagai berikut. Adanya noise pada file wav. yang direkam mempengaruhi besarnya persentase pengenalansuara sehinga semakin banyak noise yang ada maka semakin berkurang tingkat pengenalannya. Di sisilain, setiap perekaman maupun pengubahan dari data yang terkontaminasi noise , membutuhkan datadasar yang dijadikan sebagai pedoman untuk mengklasifikasikan data dan memprosesnya. Pemisahanmaupun penghilangan noise dari data dapat berpeluang besar untuk menciptakan noise baru yang

    berpotensi lebih kecil maupun lebih besar terdapat dalam data.

    Adapun dengan pemisahan noise , nilai data yang terdapat pada record tempat noise beradadapat dinormalisasikan. Namun, pada pengenalan suara tetap akan berkurang tingkat akurasinyakarena hilangnya nilai node kontinu pada record . Pada percobaan dan analisis pada evaluasi proseskalkulasi, rata-rata didapatkan pengenalan suara pada tingkat persentase 58.3% yang mungkindisebabkan oleh hal tersebut, walaupun tidak sampai 80% namun pengenalan suara dapat dikatakan

    berhasil dengan akurasi lebih dari 90%.

    A2 A3 B2 B3 C2 C3 D2 D3

    A1 0.5149 0.5576 0.3314 0.4384 0.2901 0.2295 0.3517 0.2951

    B1 0.3845 0.3167 0.4602 0.5133 0.3115 0.2861 0.3820 0.3945

    C1 0.2901 0.2261 0.2107 0.2189 0.4885 0.6133 0.3122 0.3512D1 0.3360 0.3127 0.4401 0.4868 0.3819 0.3946 0.7354 0.7819

  • 7/26/2019 03 Ashadi S. Absensi

    10/10

    J l M S V l 8 N 1 J i 2008 25 3434

    DAFTAR PUSTAKA

    Alam, Agus J. 2005. Pemrograman Database Borland Delphi dalam SQL Server 7.0 & 2005. Jakarta:PT Elex Media Komputindo.

    Dubnov, Sholomo and Adiel Ben-Shalom. 2003. Review of ICA and HOS Methods for Retrieval of Natural Sounds and Sound Effects . Nara, Japan. April 2003. 4th International Symposium onIndependent Component Analysis and Blind Signal Separation (ICA2003).http://music.ucsd.edu/~sdubnov/Papers/ReviewICA03.pdf

    Fryantoni, Driszal. 2004. Proses Sampling Fundamental Frequency dengan MABC. Diakses darihttp://www.informatika.lipi.go.id/jurnal/proses-sampling-fundamental-frequency-dengan-mabc/

    Kmrinen, Joni dan Pekka Paalanen. 2003. GMMBAYES - Bayesian Classifier and GaussianMixture Model ToolBox. Lappeenranta University of Technology. Diakses darihttp://www.it.lut.fi/project/gmmbayes/

    Paalanen, P., J.K. Kamarainen, J. Ilonen, and H. Klviinen, 2005. Feature Representation andDiscrimination Based on Gaussian Mixture Model Probability Densities - Practices andAlgorithms. Research Report 95, Lappeenranta University of Technology, Department ofInformation Technology, Diakses darihttp://www.it.lut.fi/project/gmmbayes/downloads/doc/laitosrap95.pdf