Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf ·...

19
Kuvia puheentutkimusprojektilta vuosina 2007–2013 Dos. Jarmo Malinen Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos Dos. Jarmo Malinen Kuvakavalkadi 2013

Transcript of Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf ·...

Page 1: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Kuvia puheentutkimusprojektiltavuosina 2007–2013

Dos. Jarmo Malinen

Aalto-yliopisto,Matematiikan ja systeemianalyysin laitos

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 2: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

The king’s speech – a serious matter

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 3: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Puheentutkimusta ja matematiikkaa?

Syopia, epamuodostumia, vammoja...

...olisiko puheakustiikan mallinnuksella jotain annettavaakirurgisten toimenpiteiden ja kuntoutuksen suunnittelulle?

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 4: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Suomen kielen vokaalit pintamalleina

Kuvat on tuotettu laskemalla MRI-datasta kudos/ilma -rajapinta.Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 5: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Aantovaylan akustiikkaa osittaisdifferentiaaliyhtaloilla

Akustisen analyysin perustyokaluja ovat 3D aaltoyhtalo

φtt = c2∆φ

ja yksinkertaisempi Websterin torvimalli

1

c2Σ(s)2∂2ψ

∂t2=

1

A(s)

∂s

(A(s)

∂ψ

∂s

)− 2παW (s)

A(s)

∂ψ

∂t.

Yhtaloita on numeerisesti ratkaistava kuvantamismenetelminhankituissa geometrioissa, fysikaalisesti mielekkailla reunaehdoillaja aanihuulimallin antamalla syotteella.

Kytkettyja passiivisia reunakontrollisysteemeja.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 6: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Akustiikka osana puheentuoton kokonaismallia “Dico”

Numeriikkaa, systeemeja ja malleja laajalla arsenaalilla.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 7: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Vokaaligeometrian [o] alimpia resonansseja FEM:lla

R1 R2R3 R4

R5 R6 R7 R8

Luvassa uutta tietoa poikittaisresonanssien roolistamm. sopraanojen ja tenorien laulutekniikan kannalta(“Singer’s Formant”).

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 8: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Helmholtz-resonanssien ja mittausten vastaavuus

Vokaalien [e] ja [o] puheesta mitattuja spektriverhokayria, joistaaanihuuliheratteen harmoninen rakenne poistettu.

102

103

−70

−60

−50

−40

−30

−20

−10

0

Spectral envelope of vowel e

Frequency (Hz)

Magnitude −

norm

aliz

ed (

dB

)

102

103

−70

−60

−50

−40

−30

−20

−10

0

Spectral envelope of vowel oe

Frequency (Hz)

Magnitude −

norm

aliz

ed (

dB

)

Mittauskayrien huiput vastaavat aantovaylan geometriastalaskettuja resonansseja, jotka on esitetty pystyviivoin (pitkittaisetvahvennettuina).

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 9: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Yhtaaikaa puhetta ja 3D MRI:ta talteen?

Haaste: Validaatiota ja parametriestimointia varten aanidatan jakuvadatan tulee kuvata tarkoin samaa tilannetta.

Metallia (erityisesti ferromagneettista) ja elektroniikkaa eijuurikaan voida kayttaa MRI-koneen sisalla. Akustinen melu.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 10: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Akustinen ratkaisu

Tarvitaan haiveteknologiaa!

Puhe ja melunayte kulkevat ensimmaiset 3 m akustisesti“puutarhaletkussa”.

Kaksikanavainen aanenkerain ja aaltojohtimet vasemmalla.Oikealla kerain ilman vaimenninrakenteita.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 11: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Mikrofonit suojattava voimakkaalta RF-taustalta

Aaltojohtimet vievat mikrofoniasetelmaan, joka on asennettuaanieristetyn ja taysin ei-ferromagneettisen Faradayn hakin sisalle.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 12: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Ongelma: aaltojohtojen pitkittaiset resonanssit

Valitettavasti:

Puhe ei vality hyvin aaltojohtimissa, joiden pituus on useitakertoja puheen tyypillisia aallon pituuksia.

Aaltojohtimien seisovat aallot resonanssitaajuuksillayliohjaavat mikrofonielementit.

Yliohjautuneet mikrofonit eivat toimi lineaarisellakayttoalueellaan. Syntyneita artefakteja ei voida poistaatallannetuista signaaleista, koska informaatiota on kadonnut.

Tarvitaan ratkaisu pitkittaisresonanssien sammuttamiseksi tai edesriittavaksi vaimentamiseksi.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 13: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Sahkoinen siirtolinja analogiana

Sahkoisissa siirtolinjoissa ongelma ratkaistaan terminaatio-vastuksella RL linjan karakteristiseen impedanssiin Z0.

Vakiot L ja C ovat jakautuneita induktansseja ja kapasitansseja.Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 14: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Akustinen siirtolinja

Aaltojohtimet ovat toinen siirtolinjatyyppi, joka on matemaattisestilaheista sukua sahkoisille linjoille.

Akustisia resistansseja RL ei ole saatavilla kaupasta, vaikka oikeaarvo (5.24 akustista megaohmia) voidaankin laskea teoreettisesti.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 15: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Toimisivatko reiat mikrofonielementtien vieressa?

Lahikuvassa neljan mikrofonin asetelma Faradayn hakin sisalta.

Kylla, mutta:

Ei taydellista vastetta, mutta riittavan hyva.

Vierekkaiset kanavat ylikuuluvat reikien kautta.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 16: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Signaalinkasittelylla jaannosresonanssit

300 600 900 1200 1500 1800 2100−30

−25

−20

−15

−10

−5

0

5

5 mm10 mm

15 mmSpeech channel

Vaimentunut pitkittaisresonanssirakenne voidaan kompensoidanumeerisesti, taajuusvastemittauksin fysikaalisella mallillakaiuttomassa huoneessa.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 17: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Akustisen melun poisto signaalinkasittelylla

MRI-huoneessa vallitsee noin 95 dB(SPL) melutaso kuvauksenaikana. Melu koostuu muutamasta taajuuskomponentistaharmonisine ylasavelineen.

Puhenaytteesta vahennetaan melunaytteen sisalto optimaalisesti.

Adaptiivinen spektraalifiltteri etsii melun harmonisen rakenteen japoistaa jaannosmelukaistan puhenaytteesta.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 18: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

Poikkitieteellisesti mukana

Prof. O. Aaltonen, Prof. R.-P. Happonen, Doc. J. Malinen

DI A. Aalto, Dr. D. Aalto, Ms. L. Altarriba, Dr. A. Hannukainen,

DI A. Huhtala, Dr. P. Jaasaari, Mr. A. Kivela, M.Sc. J. Kuortti,

Dr. T. Lukkari, HLK J.-M. Luukinen, M.Eng. T. Murtola, Lic. P. Palo,

Doc. R. Parkkola, Dr. J. Saunavaara, Doc. T. Soukka, Doc. M. Vainio.

Dos. Jarmo Malinen Kuvakavalkadi 2013

Page 19: Kuvia puheentutkimusprojektilta vuosina 2007 2013speech.math.aalto.fi/pdf/kuvakavalkadi.pdf · 2018-05-31 · Kuvia puheentutkimusprojektilta vuosina 2007{2013 Dos. Jarmo Malinen

That’s all, folks. Questions?

Dos. Jarmo Malinen Kuvakavalkadi 2013