SUBJECTIVE AND OBJECTIVE MEASURE ON ... - digilib.its.ac.id

Post on 30-Nov-2021

6 views 0 download

Transcript of SUBJECTIVE AND OBJECTIVE MEASURE ON ... - digilib.its.ac.id

Oleh:Oleh:Oleh:Oleh:

ANINTYO ADI NUGROHONRP. 2406 100 039

Oleh:Oleh:Oleh:Oleh:

ANINTYO ADI NUGROHONRP. 2406 100 039

SUBJECTIVE AND OBJECTIVE MEASURE ON SPEECH

INTELLIGIBILITY BY RELEASE OF MASKING PHENOMENON

SUBJECTIVE AND OBJECTIVE MEASURE ON SPEECH

INTELLIGIBILITY BY RELEASE OF MASKING PHENOMENON

NRP. 2406 100 039

Pembimbing:Pembimbing:Pembimbing:Pembimbing:

Dr. Dhany Arifianto S.T, M.EngNIP : 197310071998021001

NRP. 2406 100 039

Pembimbing:Pembimbing:Pembimbing:Pembimbing:

Dr. Dhany Arifianto S.T, M.EngNIP : 197310071998021001

JURUSAN TEKNIK FISIKAFAKULTAS TEKNOLOGI INDUSTRIINSTITUT TEKNOLOGI SEPULUH

NOPEMBERSURABAYA

2010

JURUSAN TEKNIK FISIKAFAKULTAS TEKNOLOGI INDUSTRIINSTITUT TEKNOLOGI SEPULUH

NOPEMBERSURABAYA

2010

+Read verse out loud for pleasure

The juice of lemons makes fine punch+

Read verse out loud for pleasureThe juice of lemons makes fine punch

Read verse out loud for pleasure

12 CHANNEL

???Read verse out loud for pleasure

+12 CHANNEL20 CHANNEL ???

Read verse out loud for pleasure

The juice of lemons makes fine punch+

Read verse out loud for pleasure

Read verse out loud for pleasure

The juice of lemons makes fine punch

+20 CHANNEL2 CHANNEL

+Read verse out loud for pleasure

The juice of lemons makes fine punch+

Read verse out loud for pleasure

TUJUANTUJUAN• Mengetahui peningkatan speech intelligibility akibat

pengaruh fenomena release of masking pada peristiwacocktail party terhadap native speakers pendengar normal

• Mengetahui pengaruh signal enhancement dalammeningkatkan kualitas suara target yang rusak akibatmaskermasker

BATASAN MASALAHBATASAN MASALAH• Menggunakan 17 orang respondennative speakers yang

memiliki pendengaran normal.• Masker yang dipilih sebagai bunyi percakapan latar adalah

suara laki – laki tunggal.• Jumlah Channel yang diaktifkan adalah 20 channel.

• Fenomena Release of Masking dapatmeingkatkan speech intelleigibility, namun

hipotesahipotesa

• Seberapa besar kah pengaruh release of masking terhadap peningkatan speech intelligibility?

• Bagaimana pengaruh terhadappeningkatan speech intelligibility setelahmelalui proses signal enhancement?

PermasalahanPermasalahan

Tes pendengaranTes pendengaranMenuliskan kembali kalimat

hasil tes pendengaranMenuliskan kembali kalimat

hasil tes pendengaran

%correct words%correct words

• Merupakan cara untuk meningkatkan kualitas sinyal suarayang rusak akibat adanya bising latar.

• Yang dikenal sampai saat ini:

1. Spectral Substraction

Minimum Mean Square Error-Short Time Spectral 2. Minimum Mean Square Error-Short Time Spectral Amplitude (MMSE-STSA)

3. Multi-Band Spectral Subtraction

Magnitude

Frekuensi

Magnitude

Frekuensi

Band ke-n

� Adalah nilai SNR Yang dihitung tiap segmen data.

Penentuan Responden

Penelitian ini melibatkan responden native speakers sebanyak 17 orang yang memiliki pendengaran normal dengan rata-rata usia 24,29 tahun

Pemilihan Stimuli

Stimuli merupakan sinyal suara yang akan diujikan kepada responden berupa suara laki-laki dan diperoleh dari database IEEE dengan frekuensi sampling 25 kHz. Jenis masker yang

digunakan adalah suaral aki-laki tunggal.

PemrosesanStimuli

Sinyal suara diproses menggunakan bandpass filter kedalam 2, 8, 12, dan 20 channelmenggunakan Matlab 7.8. Sinyal suara dikombinasikan menggunakan audacity 1.3 dengan

SNR 0 dB dan frekuensi sampling 25 kHz.

Sinyal suara diproses menggunakan bandpass filter kedalam 2, 8, 12, dan 20 channelmenggunakan Matlab 7.8. Sinyal suara dikombinasikan menggunakan audacity 1.3 dengan

SNR 0 dB dan frekuensi sampling 25 kHz.

Penentuan %correct words

Sebanyak 14 responden diperdengarkan 60 kalimat stimuli dengan kombinasi target danmasker (stimuli) yang memiliki perbandingan channel 2 dan 20, 8 dan 20, 12 dan 20, 12 dan 2,

12 dan 8, 12 dan 12, 20 dan 2, 20 dan 12, 20 dan 20. pemutaran stimuli hanya dilakukan satukali dan tidak dapat diulang. Setelah itu responden diharuskan untuk menuliskan ulangkalimat-kalimat stimuli, setelah itu akan dilakukan penghitungan nilai %correct words

Sebanyak 14 responden diperdengarkan 60 kalimat stimuli dengan kombinasi target danmasker (stimuli) yang memiliki perbandingan channel 2 dan 20, 8 dan 20, 12 dan 20, 12 dan 2,

12 dan 8, 12 dan 12, 20 dan 2, 20 dan 12, 20 dan 20. pemutaran stimuli hanya dilakukan satukali dan tidak dapat diulang. Setelah itu responden diharuskan untuk menuliskan ulangkalimat-kalimat stimuli, setelah itu akan dilakukan penghitungan nilai %correct words

30

40

50

60

70

80

90

100

%co

rre

ct w

ord

s (%

)

Grafik %correct words vs stimuli dari percobaan 1

0

10

20

30

2 dan 20 8 dan 20 12 dan 20 20 dan 2 20 dan 12 20 dan 20

stimuli

40

50

60

70

80

90

100

corr

ect

wo

rds

(%)

0

10

20

30

40

12 dan 2 12 dan 8 12 dan 12 12 dan 20 20 dan 2 20 dan 12 20 dan 20

%co

rre

ct w

ord

s (%

)

stimuli

Grafik %correct words vs stimuli dari percobaan 2

Enhancement Stimuli

Campuran stimuli di enhancing dengan algoritmaSSBoll79, SSBerouti79, SSSCalart96, SSMutlibandKamath02, SSPARAB98, MMSECohen2004,

MMSESTSA84, MMSESTSA85 menggunakan software matlab 7.8®.

Campuran stimuli di enhancing dengan algoritmaSSBoll79, SSBerouti79, SSSCalart96, SSMutlibandKamath02, SSPARAB98, MMSECohen2004,

MMSESTSA84, MMSESTSA85 menggunakan software matlab 7.8®.

Penentuan %correct words setelah prosesenhancement

Sebanyak 3 responden diperdengarkan 630 kalimat stimuli dengan kombinasitarget dan masker (stimuli) yang memiliki perbandingan channel 12 dan 2, 12 dan

8, 12 dan 12, 12 dan 20, 20 dan 2, 20 dan 12, 20 dan 20 pemutaran stimuli hanyadilakukan satu kali dan tidak dapat diulang. Setelah itu responden diharuskanuntuk menuliskan ulang kalimat-kalimat stimuli, setelah itu akan dilakukan

penghitungan nilai %correct words

Sebanyak 3 responden diperdengarkan 630 kalimat stimuli dengan kombinasitarget dan masker (stimuli) yang memiliki perbandingan channel 12 dan 2, 12 dan

8, 12 dan 12, 12 dan 20, 20 dan 2, 20 dan 12, 20 dan 20 pemutaran stimuli hanyadilakukan satu kali dan tidak dapat diulang. Setelah itu responden diharuskanuntuk menuliskan ulang kalimat-kalimat stimuli, setelah itu akan dilakukan

penghitungan nilai %correct words

40

50

60

70

80

90

100

%co

rre

ct w

ord

s (%

)

0

10

20

30

12 dan 2 12 dan 8 12 dan 12 12 dan 20 20 dan 2 20 dan 12 20 dan 20

%

stimuli

Grafik %correct words vs stimuli dari percobaan 3

Hasil penelitian pertama yang di tunjukkan pada grafik pertamamenunjukkan hasil nilai %correct words yang berbeda-beda untuktiap campuran stimuli. Pada campuran 2 dan 20, 8 dan 20, 12 dan 20menunjukkan stimuli masker lebih dominan daripada stimuli target.Respoden lebih cenderung mudah memahami stimuli maskerdaripada stimuli target. Pada campuran 20 dan, 20 dan 12, 20 dan 20menunjukkan stimuli target lebih dominan daripada stimulimasker, sehingga responden cenderung lebih mudah memahamistimuli target daripada stimuli masker

Hasil penelitian kedua yang di tunjukkan pada grafik keduamenunjukkan hasil nilai %correct words yang berbeda-beda untuktiap campuran stimuli. Pada campuran 12 dan 2, 12 dan 8, 12 dan 12menunjukkan stimuli target lebih dominan daripada stimulimasker., namun dengan power yang sedang Respoden lebihcenderung mudah memahami stimuli target daripada stimuli masker.Pada campuran 20 dan, 20 dan 12, 20 dan 20 menunjukkan stimulitarget lebih dominan daripada stimuli masker, dengan power stimulitarget lebih kuat sehingga responden cenderung lebih mudahmemahami stimuli target daripada stimuli masker

Hasil penelitian ketiga yang di tunjukkan padagrafik ketiga menunjukkan hasil nilai %correct wordsyang berbeda-beda untuk tiap campuran stimuli. Padacampuran 12 dan 2, 12 dan 8, 12 dan 12 menunjukkanstimuli target lebih dominan daripada stimulimasker, namun dengan power yang sedang Respodenmasker, namun dengan power yang sedang Respodenlebih cenderung mudah memahami stimuli targetdaripada stimuli masker. Pada campuran 20 dan, 20 dan12, 20 dan 20 menunjukkan stimuli target lebih dominandaripada stimuli masker, dengan power stimuli targetlebih kuat sehingga responden cenderung lebih mudahmemahami stimuli target daripada stimuli masker

2

3

4

5

6

7

8

9

10N

ila

i se

gS

NR

(d

B)

Grafik Hasil uji signal enhancement daripercobaan 1 dan 2

0

1

2

signal enhancement

1

1.5

2

2.5

3N

ila

i se

gS

NR

(d

B)

Grafik Hasil uji signal enhancement daripercobaan 3

0

0.5

signal enhancement

Berdasarkan penelitian yang telah dilakukan maka dapatdiambil beberapa kesimpulan yakni:

� Pengaruh release of masking telah menunjukkanpeningkatan pada speech intelligibility, hal ini terlihat darigrafik pertama dan grafik kedua yang menujukkan, campuranstimuli target yang lebih dominan menujukkan nilai %correctwords yang tinggi daripada campuran stimuli masker yangwords yang tinggi daripada campuran stimuli masker yanglebih dominan

� Dari delapan teknik signal enhancement yangdigunakan, teknik Spectral Substraction by Boll (SSBoll79)masih menunjukkan hasil yang paling baik, hal ini terlihatpada grafik “Nilai SegSNR HASILUJI SIGNAL ENHANCEMENT” bahwa teknik SSBoll79menunjukkan nilai tertinggi yakni 8.75566 dB (pada grafikpertama), dan 2.57499 dB (pada grafik kedua)