Frekvencijska svojstva ljudskog uha
description
Transcript of Frekvencijska svojstva ljudskog uha
![Page 1: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/1.jpg)
Frekvencijska svojstva ljudskog uha
Nina Marević & Branimir Dropuljić
![Page 2: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/2.jpg)
Kako čujemo?
Nakon što su podražene osjetne slušne stanice dolazi do pretvaranja mehaničke energije zvuka u električni impuls koji se provodi putem slušnog živca i slušnog puta do moždane kore gdje nastaje svjesna percepcija zvuka.
![Page 3: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/3.jpg)
Kako napraviti aproksimaciju ljudskog sluha na računalu?
Zvuk kojeg ljudsko uho čuje se kreće od 20-tak Hz do 20kHz.
Frekvencije ispod 20 ili iznad 20 kHz ne primjećujemo u prirodi i nije ih potrebno propuštati u programskom modelu.
Karakteristično je za ljudsko uho da ne čuje sve frekvencije jednako.
Selektivnost na najnižim je frekvencijama oko 100
Hz, ali na onim višim iznosi i više od 4 kHz
![Page 4: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/4.jpg)
Kako napraviti aproksimaciju ljudskog sluha na računalu?
IDEJA: raspon frekvencija koje čovjek čuje razdijeliti u 30-ak pojaseva preko 30-ak filtara
Samo tu frekvencijsku skalu nećemo podijeliti linearno - nego prema mel-skali, jer ona više odgovara prirodnim karakteristikama ljudskog uha.
Veza mel skale s
frekvencijskom se definira kao:
Mel= 1127.01048 loge(1+f/700)
![Page 5: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/5.jpg)
Kako smo osmislili sklop?
Algoritam:
projektiranje filtara logatiram anvelope energija svakog kanala primjena brzog kepstra na svaki uzorak zasebno decimiranje signala
![Page 6: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/6.jpg)
Kako smo pisali kod?
prvi korak je projektiranje filtara u mel skali svi su filtri jednaki u frekvencijskoj skali vidimo da su selektiviniji
za niže frekvencije, a manje selektivni za više baš takva je i karakteristika ljudskog uha
![Page 7: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/7.jpg)
Filtri
Svaki pojedini filtar konvoluiramo s istim Blackmannovim otvorom - da bi dobili glađi impulsni odziv jednake duljine za svaki filtar
Također ćemo y-os prikazati i u logaritamskom mjerilu
![Page 8: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/8.jpg)
Filtri
U idealnom slučaju kad zbrojimo sve filtre po y-osi bi trebali dobiti svepropusni filtar iznosa jednakog koeficijentu preklapanja filtara.
Ali prvi i zadnji filtar imaju centre na samim rubovima, oni i nekoliko njima najbližih trokutastih filtara s kojima se preklapaju, nemaju potpun obllik trokuta, nego su “prekinuti”
Zato se javljaju propadi na početku i na kraju prikaza odstupanja.
![Page 9: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/9.jpg)
Impulsni odzivi
Svi impulsni odzivi flitara zbrojeni bi trebali davati jedinični impulsni odziv, odnosno dirach u nuli.
Desna slika prikazuje koliko smo pogriješili, tj.
razliku Diracha i onoga što smo mi dobili.
![Page 10: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/10.jpg)
Impulsni odzivi
Prvi filtar ima najširi i najniži impulsni odziv, te kao takav propušta niže frekvencije.
Zadnji filtar ima najuži i najviši impulsni odziv, te kao takav propušta više frekvencije.
![Page 11: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/11.jpg)
Signal kojeg smo obrađivali
izgovor 6 samoglasnika "a", "e", "i", "o", "u", "з“
Frekvencija otipkavanja je 44 kHz
![Page 12: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/12.jpg)
Izlaz pojedinih
filtara
![Page 13: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/13.jpg)
Izlaz sklopa
kada pozbrojimo izlaze svih kanala - dobijemo opet izgovor gotovo identičan ulaznom signalu
ulazni signal zamisliti kao ono što nam neko kaže,a sumu, tj.izlazni signal -kao ono što naše uho čuje
preslušavajući sumu izlaza kanala primjećujemo da je razumljivost zadovoljavajuća
![Page 14: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/14.jpg)
Izlaz sklopa
Za prikaz najpogodnija anvelopa od logaritma energije.
Signal se prvo kvadrira i kroz filtar (impulsni odziv veličine 1000 uzoraka, gladak)
Nakon konvolucije, signal se logaritmira, i množi s 10
Cilj je dodatno naglasiti niže frekvencijske komponente
![Page 15: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/15.jpg)
Prikaz rezultata
Spektrogram - prikaz promjene frekvencijskih karakteristika signala u vremenu.
Visina (boja) je treća dimenzija spektrograma-koja prikazuje kolko je jako izražena pojedina frekvencija za pojedini uzorak.
smetnja gradske mreže niže frekvencije bolje
pokrivene
![Page 16: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/16.jpg)
Dotjerivanje rezultata
promatramo jedan uzorak kakvim ga vide svaki od 31-og kanala
krivulja je izlomljena to nam ne odgovara –
uzrokuje grube prelaze u spektrogramu u smjeru y- osi.
glađenje primjenom kepstara
![Page 17: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/17.jpg)
razlika log-en-spektara prije i nakon zaglađivanja – možemo uočiti da tamo gdje su bile najveće promjene, skokovi, na razlici slika su maksimumi
to znači da je zaglađivanje bilo uspješno
![Page 18: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/18.jpg)
Nulti kepstar predstavlja DC-komponentu spektra, odnosno srednju vrijednost (energiju uzorka signala)
energije u trenutcima izgovora su znatno veće od energija u trenutcima tišine, stoga nam nulti kepstar može dobro poslužiti za detekciju govora
vrši se decimacija izlaznih signala po vremenu, (faktor decimacije takav da na kraju nemamo više od 10000 uzoraka)
![Page 19: Frekvencijska svojstva ljudskog uha](https://reader035.fdocuments.net/reader035/viewer/2022081503/568147a3550346895db4da1c/html5/thumbnails/19.jpg)
Hvala na pažnji !!!