Post on 13-May-2015
VPT 20081
Spraakverstaanbaarheid(criteria, normalisatie, subjectieve en objectieve
verstaanbaarheidsmaten, toepassingen en voorspelkracht)
Herman J.M. Steeneken
(www.steeneken.com)
VPT 20082
• Kwaliteit van Spraakcommunicatie
• Spraakverstaanbaarheidmaten
• Evaluatiemethoden (subjectief-objectief)
• Voorspellingsmethoden
• Samenvatting
Overzicht
VPT 20083
Het communicatiekanaal
VPT 20084
Spreker (stem, moedertaal, vocale inspanning)
Transmissiepad (lawaai, akoestiek, vervorming)
Luisteraar (gehoor, moedertaal)
Het communicatiekanaal
VPT 20085
Spraakcommunicatiekwaliteit
Spraakwaliteit
Spraakverstaanbaarheid
Vocale inspanning
Objectieve voorspellingsmethoden
VPT 20086
Toepassing en criteria (ISO-9921)
Toepassing bij: verst. “vocal effort”
Gevaar en waarschuwing matig luid Persoon-tot-persoon (kritiek) redelijk luid Persoon-tot-persoon (algemeen) goed ontspannen Omroepinstallaties openbaar goed normaal Persoonlijke comm. systemen goed normaal
VPT 20087
Evaluatiemethoden
Subjectieve evaluatie• meerdere sprekers en luisteraars• specifieke testmethoden• representatief• resultaten soms niet reproduceerbaar
Objectieve evaluatie• voorspelling van verstaanbaarheid• diagnostisch• reproduceerbaar
VPT 20088
Subjectieve evaluatie
• Mean Opinion Scores (korte zinnen)beoordeling op (vijfpuntsschaal), zeer veel ppn.
• Speech Reception Thresholdslechts voorspelling bij 50% zinsverstaanbaarheid
• (Nonsens)woorden in (dragerzin)indirect, groot bereik, arbeidsintensief
VPT 20089
Objectieve evaluatiemethoden
• Speech Interference Level (SIL)beperkt tot directe communicatie in lawaai
• Speech Transmission Index (STI)geschikt voor alle soorten vervorming
• Speech Intelligibility Index (SII)geen niet-lineaire en temporele vervorming
VPT 200810
Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten
VPT 200811
Kwalificatie Sent.% CVC % PB % STI LSA – LLN
nonsens bestaande dBwoorden woorden
Uitstekend 100 >81 > 98 >0.75 21
Goed 100 70-81 93-98 0.60-0.75 15 - 21
Redelijk 100 53-70 80-93 0.45-0.60 9 - 15
Matig 70-100 31-53 60-80 0.30-0.45 3 - 9
Slecht <70 <31 <60 < 0.30 <3
Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten
VPT 200812
Demonstratie van vier kwalificaties
Uitstekend SNR = 11 dB
Goed SNR = 5 dB
Redelijk SNR = 1 dB
Matig SNR = - 4 dB
Toegevoegde ruis op basis van het gemiddeldespraakspectrum
VPT 200813
Toepassing Verst. SIL STI Vocale
inspan.
Alarm Waarschuwing matig 9 0.45 Luid
Persoon-tot-persoon (kritisch) redelijk 9 0.50
Luid
Persoon-tot-persoon (ontspan.) goed 15 0.60 Ontspan.
Omroepinstallatie openbaar redelijk 11 0.50 Normaal
Persoonlijke communicatie redelijk 11 0.50 Normaal
Criteria ISO-9921
VPT 200814
Voorspellingsmethoden
SIL, vocale inspanning, omgevingslawaai
STI, vocale inspanning, geslacht spreker,omgevingslawaai, bandbreedte-beperking,
maskering, nagalm, echo’s, niet-lineairiteit,(IEC 60268-16)
SII, vocale inspanning, omgevingslawaai,bandbreedte-beperking, maskering,(ANSI 305.2)
VPT 200815
Demonstratie van kwalificatie “Redelijk”
Redelijk SNR = 1 dB, (STI = 0,53)geen bandbreedte-beperking
Redelijk SNR = 3 dB, (STI = 0,53)bandbreedte 375 - 5600 Hz
Toegevoegde ruis op basis van het gemiddeldespraakspectrum
VPT 200816
Speech Transmission Index (STI)
Gewogen SNR levert voorspelling spraakkwaliteit
VPT 200817
Modulatieoverdracht (lijnfrequentie)
VPT 200818
Omhullende funktie en spectrum
VPT 200819
Omhullende funktie met nagalm en ruis
VPT 200820
Modulatieoverdracht (MTF)
De MTF wordt verkregen door de omhullende-spectra van het originele en ontvangen spraaksignaal te vergelijken
VPT 200821
Matrix voor zeven MTF’s
1 Hz
X
3 Hz
10 Hz10 Hz
VPT 200822
Modulatieoverdracht meten met testsignaal
VPT 200823
Berekening STI (Spraak Transmissie Index)
Voor elke octaafband wordt eerst de effectieve SNR bepaald
De gewogen octaaf-bijdrage levert de STI
VPT 200824
octave-band centre frequency (Hz)
freq
uenc
y-w
eigh
ting
fact
or
0.0
0.1
0.2
0.3
0.4
0.5
125 250 500 1k 2k 4k 8k
nonsense syllables (Pavlovic et al. 1984, ANSI S3.5)PB-words (Steeneken et al. 1980, IEC 60268-16)initial consonants (Steeneken, 1992)vowels, (Steeneken, 1992)
Optimale frequentieweging
De bijdrage perfrequentieband hangtaf van het type spraak
VPT 200825
Redundante informatie is overbodig!
VPT 200826
octave-band centre frequency (Hz)
fre
qu
en
cy-w
eig
htin
g fa
cto
r
0.0
0.1
0.2
0.3
0.4
0.5
125 250 500 1k 2k 4k 8k
CVC words male speech female speech
Redundantie in het spraakspectrum
VPT 200827
Proefpersonen aan het werk
VPT 200828
Proefpersoon responsies
CVC woorden, dragerzin:
versta des overen nu fijs uithet woord zek eindenoteer lal punt
“Semi random” combinatievan:
17 beginmedeklinkers15 klinkers11 eindmedeklinkers
VPT 200829
Relatie tussen woordscores en STI
STI r
CV
C-w
ord
scor
e (%
)
1
2
3
4
5
6
78
9
10
11
12
13
14
15
16
17
18
0
20
40
60
80
100
0.0 0.2 0.4 0.6 0.8 1.0
male speech
Relatie STI/CVC-score voor mannelijke spraak en condities met ruis en bandbreedte-beperking
De verticale spreiding bedraagt s.d. 4.8%
VPT 200830
STI voor Cabine-omroepinstallatie
VPT 200831
Iso STI-contouren in collegezaal
VPT 200832
STI als funktie het omgevings-lawaainiveau
Twee condities (met en zondertoespreekinstallatie)
Verschil in lawaainiveau bijzelfde STI-waarde leverteffectieve versterking van detoespreekinstallatie
Effectieve versterking van PA-systeem
VPT 200833
STI gemeten met spraaksignalen
MTF via verschil vanomhullendespectra vanverzonden en ontvangenspraaksignalen
Toepasbaar bij ruis, nagalm en echo’s maarniet bij niet-lineairevervorming
VPT 200834
RASTI (room acoustical STI, 1980)
Screening-apparaat
2 Octaafbanden
Continu testsignaal
Verouderd (gebruik STIPA)!
VPT 200835
STIPA (STI Public Address, 2001)
Evaluatie voor Public Address
Omvat: akoestische omgeving, bandbreedtebeperking, oversturingsvervorming
Zeven octaafbanden (125 Hz en 250 Hz samen)
Complex omhullende (2 simultane modulatie- frequenties per band)
zie: IEC 60268-16
VPT 200836
Conclusies
Criteria voor vele toepassingen volgens ISO-9921
Subjectieve methoden: representatief, niet diagnostisch
Objectieve methoden: voorspellen, snel, diagnostisch