Dolgozat címe: Taktilis kijelző alkalmazások Konzulens...
Transcript of Dolgozat címe: Taktilis kijelző alkalmazások Konzulens...
Mérnöki tervezés beszámoló Dolgozat címe: Taktilis kijelző alkalmazások Konzulens neve: Tihanyi Attila
Hallgató neve: Eszter András
Leadás dátuma: 2005. december
2
Tartalomjegyzék
Feladat rövid ismertetése 4
Bevezetés 5
Tapintás 6
Az ujjak, mint érzékszervek 6
A tapintás tulajdonságai 8
A tapintás érzékenysége és pontossága 8
A tapintási ingerlés lokalizációja 9
Beállítódás és tapintási érzékenység 10
A tapintás élettana 12
A tapintási rostok 12
A rostok tevékenysége és a tapintási élmények 14
Az érintési ingerlés által kiváltott idegi válaszok és észlelési ítéletek 14
Az idegi ingerlés által kiváltott tapintási minőségek 15
A tapintási receptorok 15
Az emberi beszéd 18
Beszédképzés 18
Alaptényezők, építőkockák 19
A beszédhangok osztályozása 21
Magánhangzók 21
Képzés 21
Formánsok 22
Formánsszerkezet 22
Mássalhangzók 23
Osztályozása 23
Zárhangok 23
B 24
D 24
G 25
Gy 26
3
Zár és réshangok 26
Dzs 27
Dz 27
Réshangok 27
S 28
Z 28
V 29
Zs 29
Nazálisok 29
Taktilis kijelző 30
A taktilis kejelzés 30
A tapitás felhasználása 31
Taktilis kijelzőtípusok 32
A rendszer tervezése 33
Az elkészített modell 35
Számítógépes szimuláció 35
Példamondat 38
Programkód 40
Tapasztalatok a taktilis kijelző használatáról 41
Továbbfejlesztési lehetőségek 41
Irodalomjegyzék 43
4
A feladat rövid ismertetése, célkitűzés
A feladat olyan vibrotaktilis eszköz elkészítése, amely halláskárosultak és siketek
számára nyújt segítséget a távközlésben. A készülék mobil alkalmazásokhoz kapcsolódó
használata, megkönnyíti a felhasználót a számukra megfelelően átalakított beszédhang
pontosabb felismerésében. A több paraméter kijelzésére alkalmas eszköz megalkotásában
törekedni kell a pontos és real-time kijelzésre, a készülék kis, hordoz mérettel kell,hogy
rendelkezzen, a csatlakoztatás és alkalmazhatóság tekintetében független és univerzális
legyen, kezelése könnyű és egyértelmű legyen.
5
Bevezetés
Az emberi élet egyik legalapvetőbb, legrégibb kommunikációs formája a beszéd. Az
emberiség története során egyre bővült a beszédre vonatkozó jellemzők, a beszéd
tulajdonságainak, formájának spektruma. Nemcsak a különféle nyelvek és kommunikációs
formák kialakulása könnyítette meg az ember életét a földön, hanem a technika fejlődésével
„korlátlannak” mondható lehetőségek tárulkoztak föl az emberiség számára ezen a téren.
Mind a hírközlésben, mind a távközlésben meg vannak azok a technikai vívmányok, amelyek
segítségével a ma embere könnyedén élheti az életét, hiszen a rádió, a tv, az Internet percek
alatt az információ felfoghatatlan mennyiségét zúdítja a nyakába, a telekommunikáció
segítségével pedig olyan térbeli határokat tud átlépni, melyek méreteiben sokszor túl is
haladják az ember felfogóképességét. Azonban vannak a társadalomnak olyan szereplői, akik
önhibájukon kívül, kimaradnak a kommunikáció egyes, fontosnak rangsorolható részeiből. Ez
a réteg a halláskárosultak, illetve a siketek rétege, akik sok esetben csak részben vagy
egyáltalán nem tudják használni a fent említett kommunikációs csatornákat. Az ő számukra a
megoldás a már létező alkalmazások kibővítése az új technológiák felhasználásával, melyeket
a távközlés, az informatika, az információs technológia nyújt az emberiség számára.
A siketek szájról olvasási képességei nagyon kifinomultak, a hallók számára
elképzelhetetlenül hatékonyak. A szájmozgásról azonban számos beszédinformáció nem
olvasható le. A nem látható, de a beszédképzés és beszédmegértés szempontjából alapvető
információ a zöngés zöngétlen hangképzés és a nyelv helyzete. A hangszalagok rezgése
kívülről nem látható, ezért szájról olvasva az azonos képzésű zöngés és zöngétlen hangpárok
nem különíthetők el (például baba-papa, feltölt feldőlt). Hasonlóan a nyelvhelyzettel
meghatározott felpattanó zárhangok nem különböztethetők meg szájról olvasással (például
tati-kati). Ugyancsak érzékelhetetlen szájról olvasásnál, hogy történik-e adott szájnyílásnál
levegő átfúvással keltett zaj vagy sem. Például (sok-ok).
A hangjelből kinyerhetők olyan képzéshez kapcsolódó jellemzők, amelyek a nem látható
képzési mozzanatokhoz kapcsolódnak és a siketek megértését segítik. Annak érdekében, hogy
az alapvető érzékelési csatornát, a látást ne zavarjuk, ezért a többletinformációt más
érzékszerv segítségével lehet átadni. Például szóba jöhet a tapintás alapú információ átadás.
Az átviendő információ időben változó mennyiségeket jelent, ezért időben változó intenzitású
rezgés ezeket közvetíteni képes.
6
A vibrotaktilis ingerlés a hanginformáció, így a beszéd bemutatására is alkalmas siketeknél.
Az akusztikus energiát vibrotaktilis ingerek mintázataivá alakítják. A vibrotaktilis ingerlés,
amelyet gyors ütögetés sorozatnak lehet érezni a bőrön, kiemeli az akusztikus átmeneteket a
hang kezdetén és végén és a beszédhang különböző jellemzőit, tulajdonságait. Amikor ezek a
hangok szavak és mondatok, akkor az eszköz viselője könnyebben tudja szegmentálni a
beszédfolyamot, ami elősegíti a szájról olvasást.
Jelen dolgozat témája egy olyan eszköz kifejlesztése, mely segítséget nyújt a hallássérültek
számára készülő beszédfeldolgozó és megjelenítő eszköz használata közben, egyértelműbbé
téve a felhasználó számára az eszköz által közvetített információt. A fejlesztés során több
tudományterület kapcsolódik össze, a neuróbiológia, a beszédfelismerés, a jelfeldolgozás, a
mikroelektronika mind részét képezik a munkának és a készülőben lévő szerkezetnek. Az
eszköz alapgondolata a következő: az emberi beszédhangot a készülék átalakítja rezgésekké,
melyek a beszédhang egy meghatározott tulajdonságát jelenítik meg mechanikai mozgás
formájában.
A munkafolyamat során a fent említett tudományágak témához kapcsolódó részeinek
bővebb megismerése elengedhetetlen volt. A fejlesztés során az alapok – neuróbiológiai
vonatkozások, beszédfeldolgozási és nyevtudományi alapok – tanulmányozása után a már
meglévő taktilis kijelzős technológiák vizsgálata következett. A már meglévő technológiák
közül lett kiválasztva egy pár a megvalósításra, melyek közül modell elkészítése és tesztelés
útján lett kiválasztva a végső megoldás. További célok a kiválasztott megoldás hardveres
megvalósítása.
A soron következő részek tartalmazzák a témához kapcsolódó háttér információkat,
melyek ismerete szükséges az elv és megvalósítási gondolat megértéséhez.
Tapintás
Az ujjak, mint érzékszervek
A tárgyak detektálásakor és felismerésekor erősen támaszkodunk látásunkra, a tapintásnak
megvan a maga megkülönböztető hozzájárulása. A tapintás segít a közeli tárgyak
azonosításában azzal, hogy információt nyújt ezeknek a tárgyaknak az alakjáról, méretéről és
súlyáról. A tapintás ad információt a tárgy felszínének textúrájáról és mechanikai
konzisztenciájáról - nem biztos, hogy ez a két tulajdonság szemmel látható. Például a
7
durvaság, simaság vagy bolyhosság finom perceptuális különbségei a tárgyak textúrájában
fizikai különbségeknek felelnek meg. Ehhez hasonlóan, a puhaság, keménység és
rugalmasság perceptuális különbségei a tárgy összenyomhatóságának különbségeiből
fakadnak.
Az érintésnek, a tapintásnak fontos jelentősége van az emberi életében. Vezető szerepet
játszik a fejlődésben, a társas kommunikáció univerzális eszköze, a vak, látás –sérült emberek
számára a kapcsolatot jelenti a külvilággal. Bizonyos értelemben az érintést fel lehet úgy is
fogni, mint a legmegbízhatóbb érzékleti modalitást. Amikor az érzékszervek ellentmondanak
egymásnak, akkor általában az érintés a végső döntő bíró. Képzeljük el, hogy kinyúlunk egy
látott tárgy felé, de a semmibe nyúlunk. A kezdeti megdöbbenés után valószínűleg úgy
döntünk, hogy a látási rendszerünket vezették félre – más szóval, a tapintás sokkal
megbízhatóbbnak tűnik, mint a látás. Filozófusok úgy gondolták, hogy a tapintás szolgáltatja
az alapot ahhoz, hogy a látási üzeneteket kalibráljuk és értelmezzük.
A tapintási érlékelés a testfelszín bármelyik részének ingerléséből fakadhat. Valóban, a bőrt
úgy is lehetne jellemezni, mint a tapintás érzékének egyetlen nagy receptorát. De ha
megtapintunk egy tárgyat, leggyakrabban a kezünk az ingerlés szerve. Az emberi kéz
csodálatos és összetett képességei a test legértelmesebb részei közé emelik a kezet. Az emberi
kézen lévő bőr mechanoreceptorok (a mechanikai nyomás vagy a bőr alakváltozására
érzékeny receptorok) ezreit tartalmazza, valamint izmok összetett csoportját, amelyek vezetik
az ujjakat, ahogy a tárgy télszínét letapogatják. A mechanoreceptorok kulcsszerepet játszanak
a tárgyak olyan részleteinek elemzésében, mint a textúra; az izmok főleg akkor járulnak hozzá
a tapintáshoz, amikor átfogóbb tulajdonságokat - például méret, súly, alak - kell elemezni.
De akár átfogóbb, akár kisebb részleteket kell felfedezni, a kéz és az ujjbegyek közvetítik a
leghasznosabb információkat a tárgyakról. A tapintás akkor a legpontosabb, ha az ujjak a
szóban forgó tárgyon mozognak. David Katz (1925), a tapintás kutatásának egyik úttörője
észrevette, hogy ha az ujjakat mozdulatlanul hagyjuk egy félszínes, akkor ez eltompítja azt a
képességet, hogy érezzük a felszín téri ,jellemzőit. Ahogy Katz megjegyezte, ha az ujjainkat
végigvisszük egy felszínen, ez fontos,jellegzetességeket árul el a félszín részletes
topográfiájáról, olyan jellegzetességekről, amelyek elvesznek, ha az ujjak mozdulatlanok.
Ahogy látni fogjuk, a tapintási érzékenységnek ez a javulása valószínűleg egy sor olyan
tapintási receptor aktiválódását sót tükrözi, amelyek viszonylag inaktívak, amikor
mozdulatlan ujjak érintkeznek mozdulatlan tárgyakkal.
8
A tapintás tulajdonságai
A tapintási élményeket a bőr valamilyen mechanikai megzavarása váltja ki, amit egy
tárgyal való fizikai kontaktus okoz. A mechanikai zavar pontos természete az érintett tárgy
fizikai tulajdonságaitól, illetve attól függően változik, hogy hogyan tapogatjuk le a tárgyat.
Van itt néhány határozott észlelési minőség, amit a tapintási ingerlés okoz; minden
minőség a tárgyak valamilyen tulajdonságának felel meg. A bőrben több különböző típusú
receptor van, amelyek a bőr mechanikai változásaira érzékenyek. Ezek közül az úgynevezett
mechanoreceptorok közül némelyek nagyon alkalmas arra, hogy a felszín durvaságáról
vegyen fel információt, míg mások alkalmasabbnak tűnnek arra, hogy a tárgyak keménységét
jelezzék.
A tapintás érzékenysége és pontossága
Kísérletekkel sikerült meghatározta azt a legkisebb nyomást, amit érezni lehet a bőrön.
Felfedezték, hogy a test különböző részeinek tapintási érzékenysége drámaian különbözik
egymástól. Például az ajkak és (alig kisebb mértékben) az ujjhegyek rendkívül érzékenyek az
érintésre; ezzel szemben a háton és a hason az érzékenység eléggé tompa. Érdekes módon a
test minden részén a nők általában érzékenyebbek a könnyű érintésre, mint a férfiak. Az is jól
ismert, hogy a tapintási érzékenység tompul, ha a bőrt lehűtik, részben azért, mert
alacsonyabb hőfokon a bőr, és így a bőrben lévő receptorok kevésbé hajlékonyak.
A tapintási érzékenységet olyan merev pálcával is meg lehet mérni, ami rezgést okoz a
bőrön. A vibrotaktilis ingerlés a legerőteljesebb a 200 Hz körüli frekvenciákon
(másodpercenként 200 nyomásváltozás). Nagyon alacsony frekvenciájú rezgéseknél (10-30
Hz-es tartományban) az érzékenységet nagyméretű pálcikával mérve kisebb érzékenységet
talpasztalunk, mint kisméretű mérőpálcát használva. A mérőpálca méretétől függetlenül a
rezgésre a tenyér a legérzékenyebb testrész, és nem az ujjak hegye.
A tapintás egy másik tulajdonságát is meg lehet mérni, nevezetesen a tapintási pontosságot.
Ezt hagyományosan a kétpont-küszöb teszttel mérik. A teszt megértéséhez képzeljük el, hogy
egy körző két hegye a bőr szomszédos területeit ingerli. Azt a minimumtávolságot, amit még
két külön pontnak érzékelünk képont-küszöbnek nevezzük. A kétpont-küszöböt alaposan
megvizsgálták a test számos területén. Amikor az ujjbegyet vizsgálják, már 2 milliméteres
távolságot is könnyen meg lehet különböztetni, a kézfejen 31-32 mm, az alkaron az éppen
9
megkülönböztethető távolság közelebb van a 30 milliméterhez, a háton a legkisebb
megkülönböztethető távolság megnő 70 milliméterre. Ez a fajta pontosság erőteljesen csökken
az életkorra.
Azok a testrészek, melyeknek tapintási pontossága nagyon jó, szintén nagyon ,jó tapintási
érzékenységgel rendelkeznek. Ugyanezek a helyek szintén nagyon jó lokalizációs képességgel
rendelkeznek: amikor az ingert a bőr ilyen területére helyezzük, a megérintett terület helyét
nagyon pontosan meg lehet becsülni. A bőrnek ezek a pontos, érzékeny területei sűrűn
tartalmaznak mechanoreceptorokat, ezek a szuperérzékeny bőrterületek aránytalanul nagy
képviselettel rendelkeznek az agykéregben.
1. ábra-A kétpont-küszöb meghatározására
szolgáló eszköz vázlata.
2. ábra-Két-pont távolsági értékek
A tapintási ingerlés lokalizációja
Bár úgy tűnik, hogy az érintés lokalizációja és a tapintás pontossága kapcsolódik
egymáshoz, egy fontos területen különböznek egymástól: az a képesség, hogy a bőrbe
nyomódó két mérőpálca relatív helyzetét megkülönböztessük, sokkal jobb, mint a fent
ismertetett kétpont-küszöb módszerével mért téri feloldóképesség. Ennek a mérésére olyan
kísérletet végeztek, melyben egyetlen pontot használtak, amit kissé,jobbra vagy balra
helyezett el egy, a fémre szerelt referenciavonaltól. Ezzel az ingerléssel a mindössze 0,17
milliméteres oldalirányú eltérést észlelni lehetett. Ez az érték sokad része a kétpont-
küszöbnek. A két pont megkülönböztetése és a relatív helyzet megkülönböztetése közötti
különbség azzal magyarázható, hogy egy pont lokalizációját, és így a relatív helyzet
megítélését több receptor egymáshoz viszonyított reakciója irányítja. Egy ilyen rostok közötti
10
kód, sokkal pontosabban képviselheti a cél helyzetét, mint amire egy magában működő
receptor lenne képes.
3. ábra-A legkisebb észlelhető elmozdulás mérésére szolgáló kísérleti eszköz
Beállítódás és tapintási érzékenység
Mindennapi tevékenységeink során néha váratlanul hozzáérünk valamilyen tárgyhoz, vagy
az ér hozzánk. Soha nem lehetünk biztosak abban, hogy mikor és hol vagyunk kitéve
érintésnek. Milyen észlelési következményei vannak annak, hogy a tapintási inger forrása és
helye bizonytalan?
Ezt a kérdést boncolgatta James Craig (1985), amikor azt kérdezte, hogyan tudják az
emberek megosztani a figyelmüket a sok lehetséges tapintási ingerhely között az ujjukon,
illetve a kezükön. Craig kísérletében az inger 108 tompa tűből állt, amelyek téglalap alakban
6 oszlopban és 18 sorban voltak elrendezve. Azt az elrendezést a személy ujjbegyére
nyomták; mindegyik tű 230 Hz-es frekvenciával tudott rezegni. Számítógép szabályozta, hogy
melyik tű rezegjen, és melyik maradjon stabil. Más-más tűk rezgésbe hozásával különböző
téri ingermintázatot lehetett adni a személy ujjhegyére. Például a számítógép olyan tapintási
mintázatot tudott előállítani, amely az ábécé különböző betűinek felel meg.
4. ábra-James Craig tapintási ingerője
Az egyik kísérletben Craig azt vizsgálta, hogy vajon a tapintási ingerlés helyének
bizonytalansága befolyásolja-e a személy ama képességét, hogy azonosítani tudja az ingerlés
mintázatát. A személy bal keze a tompa tűkből álló kísérleti eszközön nyugodott, míg a
tapintási rezgéseket egy időben adták a mutató- és a középső ujjra; minden egyes próba során
11
a mutatóujj és a középső ujj más-más betű tapintási ingerét kapta. A rövid idejű bemutatás
után a személyeknek meg kellett mondaniuk, hogy az egyik ujjukat milyen betű ingere érte.
Craig két helyzetben vizsgálta a személyeket. Az egyikben a személlyel az ingerlés előtt
közölték, hogy melyik ujjara figyeljen, míg a másikban ezt csak az ingerlés után mondták
meg. Az emberek sokkal pontosabbak voltak a betű megnevezésében, ha előre tudták, melyik
ujjukra figyeljelek.
Egy következő kísérletben Craig azt vizsgálta, hogy az emberek össze tudják-e vonni az
egymás melletti ujjak tapintási információit. Néhány esetben a vibrotaktilis mintázat egyetlen
ujjat érintett, máskor pedig a mintázat két egymás melletti ujjon oszlott meg. Craig azt
feltételezte, hogy a két ujjra kiterjedő mintázat arra kényszeríti a személyt, hogy gyorsan
irányítsa figyelmét egyik ujjáról a másikra, ami rontani fogja a teljesítményét. Craig
elvárásainak megfelelően jelentősen jobb volt a megnevezés akkor, ha az egész vibrotaktilis
mintázat egyetlen ujjat érintett. Általában Craig munkája azt mutatja, hogy a tapintási ingerlés
helyének bizonytalansága megnehezíti az inger azonosítását.
Mivel az észlelés gyakorlással javítható - ezt hívjuk Perceptuális tanulásnak -,
természetesen merül fel a kérdés, hogy milyen fajta tréning tenné ügyesebbé az embert az
ingerek tulajdonságainak pontos felismerésére.
Néha a süket és vak személy a beszélő arcára teszi a kezét. Ez a mozdulat részben azt az
erőfeszítést tükrözi, amit a vak és süket ember tesz annak érdekében, hogy- megértse, mit
mondanak. A cél az, hogy érzékelje a beszélő szája, nyaka és állkapcsa által keltett
rezgéseket.
A tapasztalt és gyakorlott személy számára ez a fortély lehetővé teszi, hogy bámulatra
méltóan jól megértse a beszédet, különösen, ha a szavakat közepes sebességgel mondják.
Nyilvánvaló, hogy amikor ezt a módszert alkalmazza, akkor a süket és vak embernek meg
kell osztania a figyelmét a kezének és ujjainak ingerelt területei között.
A bizonyosság hatása az agyi tevékenység változásaiban jelenik meg. Így tehát pusztán
annak az elvárása, hogy egy bizonyos ujjat fognak ingerelni, megnöveli az adott ujj
képviseletéért felelős agyterület anyagcsere-tevékenységét. Mindezek mellett legalább egy
agyterületen, a temporális kéregben bizonyos sejtek egyértelműen különbséget tudnak tenni a
várt és a nem várt tapintási inger között. Ezek a sejtek erősen reagálnak, amikor a bőrt
váratlanul érintik meg, de nem válaszolnak ugyanerre az érintésre, ha előre tudják, hogy
közeleg az érintés.
12
Tekintsük át röviden. A bőr mechanikai megzavarását többféle specializált receptor
regisztrálja a bőr különböző rétegeiben. A tapintási ingerlésből származó idegi impulzusokat
ezeknek a receptoroknak az afferensei szállítják a gerincvelőbe, ahol az impulzusok olyan
rostokra kerülnek át, amelyek felfelé haladnak az agyba. Az agyon belül a tapintási
információt több specializált kérgi terület dolgozza fel, amelyek tartalmazzák a testfelszín
térképét.
A tapintás élettana
A tapintási rostok
A kéz tapintási ingerléséből származó információt két külön ideg továbbítja a
gerincvelőbe, az ulnaris (singcsonti) és a medianus (középső) ideg. Mint minden más ideg, ez
a kettő is sok axonból, vagy ahogy másképp is nevezik, rostból áll. Az ulnaris és a medianus
idegekben az axonok a kéz különböző területeiről erednek. A medianus ideg, ahogy a neve is
mutatja, a kar közepén fut le, és kettéágazik, hogy beidegezze a tenyér egy részét, a hüvelyk-,
mutató- és középső ujjat teljes egészében, valamint a gyűrűsujj középső ujj felé néző felét. Az
ulnaris (singcsonti) ideg a singcsont latin nevéről kapta a nevét a singcsont az alkar hosszú
csontja, ami a könyöktől a csuklóig terjed, a kar külső oldalán. Az ulnaris ideg rostjai a tenyér
többi részéből, a kisujjból és a felé néző gyűrűsujjból szállítanak üzeneteket.
5. ábra-A medianus és ulnaris idegek beidegzési mintázata
13
Minden egyes rost tüzelni kezd, ha a bőr egy bizonyos részét megérintik. Az a bőrterület,
amelynek az ingerlése befolyásolja egy rost aktivitását, alkotja a rost receptív mezőjét.
A rostnak különböző bőringerekre adott válaszmintázatát elemezve az emberi tenyérre és
ujjhegyekre adott tapintási információt négy lehetséges kategóriába sorolhatjuk. A négy
kategóriát annak alapján lehetett elkülöníteni, hogy mennyire volt éles a rostok receptív
mezőjének a határa, és hogy milyen volt a rostok válaszmintázata. Mint látni fogjuk, a téri és
idői választulajdonságok lehetővé teszik, hogy minden rostkategória valami egyedit jelezzen a
receptív mezőjén belüli ingerforrásról.
Idői jegyek • Képzeljük el, hogy egy kis pálcikát nyomnak könnyedén a bőrre, és ezt rövid
ideig ott tartják. Sok különböző rost tevékenységét vizsgálva két rosttípus volt ami az inger
feldolgozásáért felelős. Volt olyan rost, amelyik akkor reagált, amikor a pálcikát először
helyezték a bőrre, és többé-kevésbé folyamatosan válaszolt, amíg tartott a nyomás. Az ilyen
típusú rostokat lassan adaptálódó rostoknak nevezzük. Más rostok csak akkor válaszoltak,
amikor a pálcikát először hozzáérintették a bőrhöz; ezek a rostok akkor is adtak egy rövid,
erőteljes választ, amikor a pálcikát eltávolították. Az ebbe a kategóriába tartozó rostok a
gyorsan adaptálódó rostok. Így tehát a szomatoszenzoros rostok első két kategóriaíja állandó
ingerlésre adott időbeni válaszuk alapján megkülönböztethető.
Téri jegyek • Most tegyük fel, hogy a pálcikát úgy használjuk fel a receptív mező
feltérképezésére, hogy egy sor szomszédos pontot ingerlünk a bőrön. A receptív mező téri
elrendezése megmutatja, hogy a lassan adaptálódó rostok és a gyorsan adaptálódó rostok is
kétfélék lehetnek. Az egyik típusú rostok: a pontrostok kis, éles határvonalú receptív mezővel
rendelkeznek. A mezők leginkább ovális alakúak, és négy-tíz, az ujjbegyen és tenyéren
található bőrbarázdát fognak át. Ezen a kis területen belül körülbelül egyforma az
érzékenység. A másik rosttípusnak, a diffúz rostoknak nagy receptív mezőjük van, életlen
határvonallal. A diffúz rostok receptív mezője néha az egész ujjat vagy a tenyér nagyobb
részét fedi. Nagy méretük és életlen határvonaluk miatt a diffúz rostok nem alkalmasak
részletes téri diszkriminációra.
A négy rostkategória • Ezt a kétféle idői és téri választ kombinálva négyféle rosttípust
kapunk: lassan adaptálódó diffúz, lassan adaptálódó pont-, gyorsan adaptálódó diffúz és
gyorsan adaptálódó pontrostok. A négy típus mindegyike eltérő üzenetet tud szállítani a
központi idegrendszernek, mivel mindegyik egy bizonyosfajta tapintási ingerlés esetén
működik a legjobban.
14
A rostok tevékenysége és a tapintási élmények
A rosttípusok működésbeli különbségeit magyarázva összehasonlíthatják, hogy milyen
válaszokat vált ki mindegyik ingerfajta a bőr körülírt területén. A mozdulatlan ujj egyetlen
helyére adott ingerlés idői mintázatának változtatása utánozza a minta - például kidomborodó
betűk - fölött mozgó ujjhegy hatását. Például, ha az ujj hegye vízszintesen mozogna a
domború O betű közepe fölött, akkor az ujjat két, egymástál egy intervallummal elválasztott
inger érné; a két inger közötti intervallum tartamában tükröződne mind a betű szélessége,
mind az ujjak mozgási sebessége. Ezért a kutatók rögzítették az afferens rostoknak a
különböző domború betűkre adott válaszát, hogy megtudják, milyen hűen regisztrálják a
rostok a betűk téri részleteit. Amikor az ingerek Braille jelek kis kiemelkedő pontjaiból álltak,
a lassan adaptálódó pontafferenseken belüli válaszok kiválóan reprodukálták a jelek téri
részleteit. A gyorsan adaptálódó pontrostok kissé lemaradtak a reprodukció hűségét illetően,
míg a másik két kategória rostjai majdnem teljes kudarcot vallottak (ami azt ,jelenti, hogy a
különböző betűkre adott válaszaikból nem lehetett rájönni, hogy milyen betűk szerepeltek).
Ez határozottan azt mutatja, hogy lassan adaptálódó pontrostok szállítják az elsődleges
információt az észlelés számára a tapintási alakról és durvaságról.
Az érintési ingerlés által kiváltott idegi válaszok és észlelési ítéletek
Amikor egy személy kezét könnyedén megérintik a pálcikával, az egyedi rostok
tevékenysége könnyedén mérhető. Amikor az alig észrevehető pálcikát a kéz csupasz,
szőrtelen részéhez érintették, akkor a gyorsan adaptálódó rostok megbízhatóan reagáltak, de a
lassan adaptálódóak hallgattak. A lassan adaptálódó rostoknak jóval erősebb tapintási ingerre
volt szükségük. Tehát ez arra utal, hogy a nagyon enyhe érintést a gyorsan adaptálódó rostok
közvetítik.
Természetesen a tapintási érzék nemcsak arra való, hogy gyenge, küszöb körüli érintési
ingereket jelezzen. Milyen rosttevékenység alakul ki erőteljesebb tapintási ingerlésre? A bőr
helyi benyomódása egyike a legmindennapibb ingerforrásoknak. Az erős ingerléseknél az
eredmények azt mutatták, miszerint a lassan adaptálódó rostok a tapintás erejével kapcsolatos
információkat regisztrálják. Meg kell azonban jegyeznünk, hogy a pszichofizikai és idegi
válaszok az idegrostok szintjén nem felelnek meg tökéletesen egymásnak, ami arra ital, hogy
a további feldolgozásnak fontos szerepe van.
15
Az idegi ingerlés által kiváltott tapintási minőségek
Ha egy adott rost valami meglehetősen konkrét dolgot jelez a tapintási érzékletről, akkor
ennek a rostnak elektromos árammal történő közvetlen ingerlése ennek az érzékletnek az
illúzióját kellene, hogy keltse a bőr egy adott helyén. Az illuzórikus érintés helye megfelelne
az ingerelt rost receptív mezőjének, az érzéklet minősége pedig elárulna valamit a rost által
szállított információról.
A lassan adaptálódó rost ingerlése minőségileg más érzékletet kelt, mint a gyorsan
adaptálódó rost ingerlése. Amikor elektromosan ingereljük a lassan adaptálódó rostot, akkor a
személyek jellegzetes válasza enyhe, egyenletes nyomást jelez. Ez ahhoz hasonlítható, mint
amikor egy puha ecsetet érintenek stabilan a bőrhöz. Amikor a gyorsan adaptálódó rostokat
ingerlik, akkor a személy egyfajta zsongó vagy vibráló bőrérzésről számol be.
Összességében az elektromos ingerléses vizsgálatok alátámasztják, hogy a lassan és a
gyorsan adaptálódó rostok másfajta információt szállítanak a tapintási ingerről.
A tapintási receptorok
Minden afferens rost legalább egy mechanoreceptorban végződik, és abból a
mechanoreceptorból szállít tapintási információt a központi idegrendszerbe. Kezünkön a sima,
csupasz bőr négy különböző mechanoreceptor-típust tartalmaz, összesen mintegy tizenhétezer
darabot. Mindegyik receptortípus olyan rostokhoz kapcsolódik, amelyeknek egyedülálló
választulajdonsága van: gyorsan adaptálódó diffúz, gyorsan adaptálódó pontrostok, lassan
adaptálódó-diffúz és lassan adaptálódó pontrostok. Maguk a receptorok feltűnően változatos
szerkezetűek és bonyolultságúak, és ez a változatosság alakítja a különböző rosttípusok
működésbeli sajátosságait. A mechanoreceptorok olyan átalakítók, amelyek a bőr
benyomódására vagy nyomására válaszolnak. Egyes receptortípusokat speciális tok vesz
körül, amelyben összenyomható folyadék vagy zselé van. A tok alakja, mérete és
elhelyezkedése határozza meg, hogy milyen tapintási ingerféleség fog a tokban lévő
receptorra hatni. Például egy olyan receptor, amely egy nagy, ovális alakú tokban helyezkedik
el a bőrben úgy, hogy a hosszanti tengelye párhuzamos a bőr felszínével, a tok feletti bőr
viszonylag nagy területét érintő alakváltozására fog reagálni. Ha azonban az ovális tok a bőr
felszínére merőlegesen állna, akkor a tapintási ingernek a bőr körülírtabb területén kellene
megjelennie ahhoz, hogy a receptort aktiválja.
16
Az ujjhegyek és a tenyér bőre - tapintásra érzékeny területekre itt külön hangsúlyt fektetűnk
- kétfajta tokos receptort tartalmaz: ezek a Meissner-testek a bőr felső rétegében és a Pacini-
testek a bőr alsó rétegében. Jelenlegi tudásunk szerint a Meissner-testecskéket és a Pacini-
testeket gyorsan adaptálódó rostok idegzik be. A 1 1.7.. ábrán két másik, nem tokos
mechanoreceptort is láthatunk: a Merkel-korongokat és a Rufini - végződéseket. Ezt a bőr
középső rétegében elhelyezkedő két receptortípust a lassan adaptálódó rostok idegzik be.
Meissner-testek • Rögtön a bőr felszíne alatt mindegyik Meissner-test egy kis szemölcsbe van
ágyazva; ezek a szemölcsök alkotják a tenyér és ujjhegyek barázdáit. A tok úgy helyezkedik
el, hogy a hosszanti tengelye merőleges a bőr felszínére. Emberben kettő-hat gyorsan
adaptálódó pontrost ered egyetlen Meissner-testben. Mivel ez az afferens egység gyorsan
adaptálódik, ez válaszol a legjobban olyan átmeneti ingerekre, amelyek akkor keletkeznek, ha
valami a bőrnek dörzsölődik, vagy amikor az ujjunkat egy tárgy felszínén végighúztuk.
Fiatal, tíz év alatti személyeknél negyven-ötven Meissner-test található
négyzetmilliméterenként; ötvenéves korra a testecskék száma negyedére csökken, körülbelül
négyzetmilliméterenként tízre. A testecskék számának csökkenése jól korrelál a tapintási
érzékenység korral összefüggő csökkenésével, amit tapintópálcikákkal mutatnak ki.
6. ábra-Ember ujjbegyének keresztmetszete
Merkel-korongok• Egy kicsit mélyebbre haladva a bőrben, a Merkel-korongokkal találkozunk.
Ezt a mechanoreceptor-fajtát, amelyet ötös-tízes csoportokban találunk meg, a lassan adaptáló
dó, ponttípusú afferens rostok idegzik be. Úgy tudjuk, hogy ezek az egységek akkor
aktiválódnak, amikor a bőrt egy kis tárgy folyamatosan nyomja.
17
Ruffini-végződések • A Ruffini-végződések mélyebben fekszenek a bőrben, hosszúkás alakjuk
párhuzamos a bőr felszínével. Minden egyes Ruffini-sejtet egyetlen afferens rost idegez be, és
a szomszédos sejtek közösen használhatnak egyetlen rostot. Ennek a bemenetnek az
összetartása analóg a szem helyzetével, ahol több pálcika-fényreceptor adja egyetlen retinális
ganglionsejt bemenetét. Emlékezzünk rá, hogy a téri konvergencia (összetartás) a fokozott
érzékenységet szolgálja a téri felbontóképesség rovására. A Ruffini-végződéseket beidegző
rostok lassan adaptálódó diffúz típusúak, és úgy hisszük, ezek az idegi egységek szolgáltatnak
információt a bőrre gyakorolt folyamatos nyomásról. Mivel a bőr nyújtására is érzékenyek,
ezek a lassan adaptálódó diffúz egységek akkor aktívak, amikor az ujjak vagy más ízületek
mozognak, és így nyújtják a bőrt.
Pacini-testek • Ezek a legnagyobb méretű, legkisebb számú és legmélyebben elhelyezkedő
mechanoreceptorok. Minden egyes testet egyetlen gyorsan adaptálódó diffúz rost idegez be. A
Ruffini-végződéshez hasonlóan a Pacini-testnek is a hosszanti tengelye párhuzamos a bőr
felszínével. A Pacini-testek rendkívül érzékenyek az érintésre. Az ujjhegy már egészen apró
alakváltozása idegi impulzusokat vált ki a Pacini-testben. Álljunk meg egy pillanatra, és
fújunk a lehető leggyengédebben a tenyerünkre. A levegő enyhe érzése a bőrünkön
valószínűleg a Pacini-testek válaszából ered. A válasz gyorsan adaptálódik. Laboratóriumi
körülmények között a kutatók a Pacini-testrendszert úgy különítik el, hogy viszonylag nagy
méretű tapintási pálcikákat rezegtetnek magas frekvenciaín.
Mivel a Pacini-testek viszonylag mélyen helyezkednek el, a bőr viszonylag nagy
területének elváltozása ingerli őket, és térben kiterjedt érzékenységet eredményeznek.
Valójában egy Pacini-test receptív mezője akár több négyzetcentiméter nagyságú is lehet.
Ugyanakkor a receptorok mélyebb elhelyezkedése a tapintási inger helyéről csak
hozzávetőleges információt nyújt.
Szabad idegvégződések • A bőr - a csupasz és a szőrrel borított is - szabad idegvégződéseket
is tartalmaz. Ezek finom, hajszálvékony struktúrák, amelyek csipkés hálózatot alkotnak a bőr
minden rétegében. A szőrrel borított bőrben a szabad idegvégződés a szőrtüsző alapjára
tekeredik rá, így a szőrszál kismértékű meghajlása is idegi impulzusokat vált ki ezekből a
tapintási afferens egységekből. Ezek a szabad idegvégződések a bőr nyálkahártyával borított
részein is igen sűrűn oszlanak el, például az ajkakon és a genitális területen. A szem
szaruhártyájában is megtalálhatók, valamint - ahogy a következő fejezetben kiderül - az
orrban is.
18
Fontos figyelembe venni, hogy a tapintás, minden más érzékelőrendszertől eltérően, a
test egész félszínén megtalálható. Ez azt jelenti, hogy sok különböző, a gerincvelő teljes
hosszán belépő afferens idegrost szolgáltat bemenetet az agy tapintási központjának. A
bemenetek eme sokasága feltűnő ellentétben áll más modalitásokkal, ahol csak egy pár
agyideg (például a bal és jobb oldali hallóideg) vagy legfeljebb három pár agyideg (a nyelvet
és szájat beidegző arcideg, nyelv-garat ideg és bolygóideg) szállítja az információkat a
perifériás szervektől a központi idegrendszerbe. Ennek következtében a sok tapintási ideg
valamelyikének károsodása csak a test azon részén okoz érzékenységkiesést,amelyet az adott
ideg érint. Más modalitások esetén az adott idegrost károsodása sokkal lesújtóbb és
kiterjedtebb kárt okoz az érzékenységben.
Az emberi beszéd
Beszédképzés
A beszéd az emberi kommunikáció és az emberi gondolkodás legfontosabb eszköze, a
kommunikáció a társadalmi élet és a munkamegosztás alapvető feltétele. A nyelv egy
jelrendszer, amelynek elemeihez egy nyelvközösségen belül ugyanaz a jelenség tartozik. A
beszéd a nyelv elsődleges megnyilvánulási formája, az egyetlen olyan kommunikációs
eszköz, mely önmagában is érthető, ezért a beszédnek az emberi kommunikációban kiemelt
szerepe van.
A beszéd két nagy folyamatra osztható: a beszédprodukcióra és a beszédfeldolgozásra.
Mindkettő számos részfolyamatból épül fel. A beszédprodukció a kódolással kezdődik,
amikor a beszélő a gondolatait a megfelelő nyelvi formába önti. Az artikuláció a nyelvi
formák hangzó változatainak létrehozása, vagyis a beszéd tulajdonképpeni képzése. Amikor
az eredeti gondolatot tartalmazó modulált levegőrezgés elhagyja a beszélő ajkait, és kikerül a
légtérbe, akkor mint akusztikai hullámforma az idő, a frekvencia és az intenzitás
paramétereivel jellemezhető. Ezek adják a beszéd akusztikumát vagy akusztikai szerkezetét.
A beszédet felfogó, hallgató személy ezeket a hullámformákat képes feldolgozni a hallás
folyamatában. Ezek a legmagasabb rendű, ún. kognitív folyamatok.
A légzőrendszernek a beszéd kialakításában is fontos szerepe van. A tüdő, a gége, a
garat, a szájüreg és az orrüreg mind részt vesz az emberi beszédképzés folyamatában .A
légzőrendszer által biztosított, a kilégzés folyamán keletkező levegőáram, ami a
19
beszédhangok döntő többségét képezi, és a beszéd során beszédszerveinkkel módosítjuk a
tüdőből kifelé áramló levegőben a nyomásviszonyokat. Ez a módosító rész az artikulációs
csatorna. Az 'artikulációs csatorna' (más szakkifejezésekkel 'toldalékcső' vagy 'hangképző
üregrendszer') a beszédszerveknek a hangréstől az ajkakig terjedő szakasza. A gégéből
kiáramló levegő az artikulációs csatornába, egy viszonylag hosszú, bonyolult formájú, de
alapvetően cső jellegű térbe jut, amelyben az útja a garat- és szájüregen és (bizonyos
esetekben) az orrüregen keresztül vezet.
A hangok végleges megformálásához nem elegendő a tüdőből kiáramló levegő, sőt
még a hangszalagok ritmikus mozgásával keltett hang, a zönge sem. A beszéd és az ének
hanganyagának nagy változatossága, végső minősége az artikulációs csatornában alakul ki.
Az artikulációs csatorna alakját, méretét az itt található önálló mozgásra képes (úgynevezett
aktív) beszédszervek – elsősorban az ajkak, a nyelv és a lágy szájpad – révén szabályozzuk.
Ennek a szerepe kettős: Az artikulációs csatorna, mint rezonáló üregrendszer működik, a rajta
átáramló hangjelet formálj, módosítja. A levegő áramlásának megváltozása hangot kelt.
A hallássérült emberek számára a szájról olvasás közben pontosan az aktív beszédszervekkel
képzett hangok felismerésénél van problémájuk. Sok esetben nem egyértelmű, a hasonlóan
képződő hangoknál, hogy mit is takar a látott kép.
Alaptényezők, építőkockák
Fizikailag a hang három paraméterrel jellemezhető: időtartam, frekvencia és
frekvenciaösszetevők, valamint az intenzitás (hangerő).
Az időtartam az az időmennyiség, amely a hangrezgés megindulásától a rezgés lecsengéséig,
azaz a hang megszólalásától annak elhalásáig eltelik. Egy-egy beszédhang ejtésének
időtartamát sok tényező befolyásolja, általánosságban azt mondhatjuk, hogy a beszédhangok
ebben az osztályozásban vagy a hanglökések közé tartoznak, vagy a rövid idejű hangok alsó
tartományára jellemző értékekkel valósulnak meg.
A frekvencia a hangrezgés időegység alatti periódusainak a gyakorisága. Az időegység
egyezményesen 1 másodperc, tehát a frekvencia az 1 másodperc alatti teljes periódusok
száma. Egy teljes periódus során a nyomás a hanghullámban a légköri nyomással megegyező
értékről a maximális értékig nő, majd a nyomásminimumig csökken, s végül ismét a légköri
nyomás értékét veszi fel. Periódusidőn (T) azt az időtartamot értjük, amely egy teljes periódus
lezajlása alatt eltelik.
A hanghullámban energia terjed tova, és az áramló energia mennyisége arányos a
hangnyomással. Az intenzitás fogalmával a hangenergia nagyságát, a hangforrás
20
teljesítményét jellemezzük. Az intenzitás a hangterjedés irányára merőleges egységnyi
felületen időegység alatt átáramlott energiamennyiség. Mértékegysége a W/m2.
A beszédhangokat felépítő akusztikai építőkockákat mutatjuk be, azaz a beszéd
általános frekvenciaszerkezetét és intenzitásszerkezetét. Mindkét szerkezeti elem az idő
függvényében változik. Ezeknek a változásoknak az idő szempontjából jellemző elemeit az
időszerkezet tartalmazza. A frekvenciaszerkezet két komponensre bontható, a formánsokat és
zörejgócokat bemutató spektrális komponensre, valamint a hangszalagrezgésből adódó
alapfrekvencia (dallam) szerkezetre.
A beszédhangok létrehozásának egyik alaptényezője a gerjesztés, vagyis a hangforrás,
amiből az artikuláció hatására a tényleges beszédhang kialakul. A gerjesztési hang alapvetően
háromféle lehet: zöngés, zörejes és kevert. A zöngés gerjesztés szabályosan ismétlődő
hanghullám, azaz periodikus (a gyakorlatban kvázi-periodikus). Ez a jel a hangszalagok
működésének eredménye, a szakirodalomban zöngének nevezik. A zörejes gerjesztés
aperiodikus rezgés, amely a gége és a szájüreg különböző pontjain keletkezhet. Az
úgynevezett kevert gerjesztésről akkor beszélünk, amikor az előbbi kettő keveréke adja a
hangképzés alapját. A gerjesztési hang megvalósulásához az energiát a tüdőből kipréselt
levegőáram adja. A gerjesztés speciális fajtája az úgynevezett néma fázis (nincs hangzó
gerjesztési jel). A néma fázis az egyes beszédhangok (például a zöngétlen zárhangok) fontos
eleme.
7. ábra-A beszédképzés szervrendzsere
8. ábra-A légáram útvonala,mozgása
A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága,
soros szerkezetű. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel
21
elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. A beszéd szerkezete felülről
nyitott, alulról pedig zárt.
Egy beszélt nyelv alapegysége a fonéma. Egy fonémakészlet elemek olyan minimális
számoságú halmaza, amelyből minden szó helyesen, de csak egyféleképpen állítható el. Az
azonos fonémákat képviselő beszédhangok az allofonok.
A beszédhangok osztályozása
magánhangzók: a, á, e, é ,i, o, ö, u, ü
mássalhangzók
zárhangok zöngés felpattanó: b, d, g, gy
zöngétlen felpattanó: p, t, k, ty
réshangok (frikatívák): zöngések j, v, z, zs;
zöngétlenek h, f, sz, s
zár-réshangok (affrikáták): zöngések dz, dzs;
zöngétlenek c, cs
nazálisok: m,n, ny
likvida: l
pergő: r
Magánhangzók
A magyarban 14 magánhangzó van, amelyeket a következő betűkkel jelölünk: á, a, o, ó, u, ú,
ü, ű, i, í, ö, ő, é, e .
Képzés
A képző mozgások szempontjából 9 magánhangzót különböztetünk meg, közülük 5 rövid-
hosszú párt alkot. A párok hosszú tagjának képzési helye szinte ugyanaz, mint a rövidé,
hangszínezete azonban kissé különbözik. Ez abból adódik, hogy a hosszúakat kissé zártabban
ejtjük, mint a rövid párjukat. A magánhangzókat a nyelv vízszintes és függőleges mozgása
szerint osztályozzuk. E szerint lehetnek elöl vagy hátul képzettek, illetve különböző
nyelvállásúak. Az állkapocs nyitási foka szerint lehetnek zártak, félig zártak és nyitottak.
További osztályozási szempont az ajakműködés, amelynek eredményeként lehetnek
ajakrésesek és ajakkerekítésesek. Az ajakréses magánhangzók második formánsa magasabb,
22
mint az ajakkerekítéseseké. Nyílt ejtés esetén az első formáns lefelé, a második esetenként
felfelé tolódik.
A magánhangzók egyszerű szerkezetűek, folyamatosan, önmagukban is ejthetők. A
mássalhangzók képzési helye hatással van az őket megelőző, illetve követő magánhangzók
képzésére. A magánhangzók akusztikai szerkezetének lényeges eleme az úgynevezett
hangátmeneti szakasz, amellyel a szomszédos hangokhoz kapcsolódnak. A magánhangzó
artikulációja sok esetben megjelenik a szomszédos mássalhangzó képzésében. Az egymásra
hatás ilyenkor kölcsönös.
Formánsok
A magánhangzók formánsai (az emberi beszédhang jellegzetes színét adó, rezonanciás úton
felerősített felhangtartomány) sávokban helyezkednek el. A formánsok egymás közötti relatív
távolsága határozza meg a hang karakterét. Ha az F1 (első formáns) magasabban van a sávján
belül, akkor az F2 (második formáns) is valószínűleg magasabban lesz a saját sávján belül. A
magánhangzók első két formánsának elhelyezkedését az is befolyásolja, hogy előttük, illetve
utánuk milyen frekvenciaszerkezetű hang van. Például az o magánhangzó F2-je alacsonyabb,
a ko hangkapcsolatban, mint a nyo-ban. Az ny F2-je ugyanis olyan magasan van az o F2-jéhez
képest, hogy az ny-ből az o-ba való artikulációs átmenet során az o nem tudja elérni a
legoptimálisabb képzési helyzetet, tehát a második formánsa magasabban realizálódik. Egy-
egy magánhangzónak tehát sokféle hangzása létezik a beszédben, ez egyrészről a
hangkörnyezettől, másrészről a beszélő személy ejtésétől függ.
9. ábra-Magánhangzók képzési formái
Formánsszerkezet
A magánhangzók frekvenciaszerkezetét általában 3 formánssal szokták jellemezni. Ezek
közül az első kettő a lényegesebb. A magánhangzók hangszínezetének kialakításánál a
formánsok frekvenciaértékén túl az egyes magánhangzók formánsainak egymástól való
úgynevezett távolsága a döntő. A magánhangzók frekvenciaszerkezete nyelvspecifikus.
23
10. ábra-Magánhangzók frekvenciaeloszlása
Mássalhangzók
Osztályozása
A mássalhangzókat a gerjesztésük szerint 3 csoportba osztjuk: zöngés, zöngétlen, és kevert.
Az utóbbi azt jelenti, hogy a zöngés elemre zörej is szuperponálódik. Időszerkezetük szerint
lehetnek egyszerűek és összetettek. Artikulációjuk szerint lehetnek stabilak (nem illeszkednek
a környező magánhangzókhoz), erősen illeszkedők és kölcsönösen illeszkedők. Akusztikai
szerkezetüket formánsokkal és zörejgócokkal jellemezzük. A magyarban a rövid és hosszú
mássalhangzók akusztikai szerkezete között nincs lényeges eltérés.
11. ábra-Mássalhangzórendszer
Zárhangok
A magyar felpattanó zárhangokat a b-p, d-t, gy-ty, g-k betűkkel jelöljük. Gerjesztésük zöngés,
illetve zöngétlen. Belső idő-, frekvencia- és intenzitásszerkezetük két fő részből áll, amelyet
24
az artikuláció határoz meg: zár és zárfelpattanás. A zárképzés az artikulációs csatornában az
egyes hangpárokra jellemző helyen jön létre. A g és k hang képzési helye változhat, a többié
nem.
12. ábra-Zárhangok
B
A b (bilabiális zöngés) zárhang zöngerészből és az azt követő zárfelpattanásból áll. A
zárfelpattanás akusztikai szerkezete hasonló hangsorkezdő és hangsorbelseji helyzetben, ettől
különböző hangsorzáró pozícióban. A zöngerész általában 15-25 dB-lel kisebb intenzitású,
mint a b hangot követő magánhangzó. A zárfelpattanáskor az intenzitás meredeken nő és
beleolvad a magánhangzó kezdeti szakaszába. A zárfelpattanás CV helyzetben rövid, 10-15
ms; hangsorzáró helyzetben hosszú, 40-50 ms. A hosszú b hang közel kétszer olyan hosszú
zöngeszakasszal rendelkezik, mint a rövid. A zárfelpattanás időtartama viszont nem változik.
A b hang zárfelpattanásának formánsai mozognak a hangot követő magánhangzó
függvényében. Ez a mozgás az F2 formánsra a legjellemzőbb:
ha VF2 600 és 1600 Hz közé esik, akkor kb. bF2 = VF2 ;
ha VF2 nagyobb 1600 Hz-nél, akkor kb. bF2 = (VF2 1600)/2 Hz.
Hangsorzáró helyzetben a hang zárfelpattanása határozott formánsszerkezetet mutat:
bF1= 400Hz, bF2 = 1200Hz, bF3 = 2300Hz.
D
A d (dentális) zöngés zárhang zöngeszakaszra és zárfelpattanásra bontható. A
zárfelpattanás akusztikai szerkezete hasonló hangsor kezdetén és hangsor belsejében, ettől
különböző hangsorzáró helyzetben. A zöngerész általában 15-25 dB-lel alacsonyabb
intenzitású, mint a d hangot követő magánhangzó. A zárfelpattanáskor az intenzitás csak kissé
növekszik és a hang beleolvad a magánhangzó kezdeti szakaszába. A zárfelpattanás CV
helyzetben rövid, 10-15 ms; hangsorzáró helyzetben hosszú, 40-50 ms. A hosszú d hang közel
kétszer akkora zöngeszakasszal rendelkezik, mint a rövid. A zárfelpattanás időtartama viszont
nem változik.
25
A d hang zárfelpattanásának formánsai elmozdulnak a hangot követő magánhangzó
függvényében. Ez a mozgás az F1 és az F2 formánsoknál jelentős:
ha VF1 kisebb, mint 400 Hz, akkor dF1 közel megegyezik a VF1-gyel;
ha VF1nagyobb, mint 400 Hz, akkor dF1 közelítőleg 400 Hz-en van;
ha VF2 kisebb, mint 1300 Hz, akkor dF2 közelítőleg 1300 Hz ;
ha VF2 1300 és 1800 Hz közötti, akkor dF2 közel megegyezik VF2-vel;
ha VF2 nagyobb, mint 1800 Hz, akkor dF2 közelítőleg 1800 Hz-en van.
Hangsorzáró helyzetben a d hang zárfelpattanása kevert gerjesztésűvé válik.
A zárfelpattanás formánsszerkezete: dF1: 300 Hz, dF2: 1600 Hz, dF3: 2600 Hz.
A zörejelem a hangsorzáró t hang frekvenciakomponenseit tartalmazza.
G
A g (veláris) zöngés zárhang. A hang zöngeszakaszból és az azt követő
zárfelpattanásból áll. A zárfelpattanás akusztikai szerkezete hasonló hangsor kezdetén és
hangsor belsejében, hangsorzáró helyzetben azonban más. A zöngerész általában 15-20 dB-lel
alacsonyabb intenzitású, mint a g hangot követő magánhangzó. A zárfelpattanáskor az
intenzitás csak kissé növekszik és a hang beleolvad a magánhangzó kezdeti szakaszába. A
zárfelpattanás CV helyzetben 35-40 ms; hangsorzáró helyzetben hosszú, 40-50 ms. A hosszú
g hang közel kétszer akkora zöngeszakasszal rendelkezik, mint a rövid. A zárfelpattanás
időtartama viszont ilyenkor sem változik.
A g hang képzési helye változik a hanghoz kapcsolódó magánhangzó függvényében.
A mássalhangzók közül ez a hang rendelkezik a legszélesebb képzési sávval. A hang
akusztikai szerkezete tehát erősen magánhangzófüggő. A g hang zöngerészből és az azt
követő zárfelpattanásból áll. A zárfelpattanás formánsai, főleg az F1 és az F2 erősen
illeszkednek a követő magánhangzóhoz:
ha VF1 kisebb, mint 300 Hz, akkor gF1 közel 300 Hz;
ha VF1 nagyobb, mint 300 Hz, akkor gF1 közel 450 Hz ;
A gF2 mindig követi a VF2-t, annál kissé 10-15 százalékkal magasabb értéket vesz fel.
Hangsorzáró helyzetben a g hang zárfelpattanásának formánsszerkezete:
gF1: 300 Hz, gF2: 1300 Hz, gF3: 2600 Hz.
A zárfelpattanás zöngés eleméhez zörej is járulhat, amely a hangsorzáró k hang
frekvenciakomponenseit tartalmazza.
26
Gy
A gy (palatális) zöngés zárhang. Ennek a mássalhangzónak az osztályozásában nincs
egységes vélemény. Vannak, akik zár-rés hangnak tartják. A hang zöngerészből és az azt
követő zárnyitódási szakaszból áll. A zárnyitódás akusztikai szerkezete hasonló hangsor
kezdetén és hangsor belsejében, hangsorzáró helyzetben azonban más. A zöngerész általában
15-25 dB-lel alacsonyabb intenzitású, mint a gy hangot követő magánhangzóé. A
zárnyitódáskor az intenzitás csak kissé növekszik, és a hang beleolvad a magánhangzó kezdeti
szakaszába. A zár nyitódása CV helyzetben 25-30 ms; hangsorzáró helyzetben hosszú, 60-80
ms. A hosszú gy hang közel kétszer akkora zöngeszakasszal rendelkezik, mint a rövid. A
zárnyitódásra fordított idő viszont ilyenkor sem változik.
A gy hang stabil frekvenciaszerkezettel rendelkezik, a zárfeloldódás formánsai
egyáltalán nem illeszkednek a hanghoz kapcsolódó magánhangzóhoz. A gy hang
zárfeloldódásának formánsszerkezete a következő:
gyF1: 300 Hz; gyF2: 2100 Hz; gyF3: 3500 Hz. A stabil frekvenciaszerkezet azt eredményezi,
hogy a gy-hez kapcsolódó magánhangzó formánsai hajlanak a gy formánsaihoz. Ezért a
magánhangzóban nagymértékű formánsmozgások jöhetnek létre, ha a két hang formánsai
távol vannak egymástól. Ilyenkor a magánhangzóban a hangátmeneti szakasz hosszabb, mint
a kölcsönös illeszkedésnél.
Zár-réshangok
A magyarban négyféle zár-rés hangnak van betűjele: dz, c, dzs, cs. Ezek a hangok
összetett szerkezetűek. Zár és rés kombinációjából állnak. Gerjesztésük lehet zöngés-zörejes
(kevert), illetve tisztán zörejes. A zár-rés hangok képzésekor a szájüreg adott helyén először
zárat képezünk, majd a zárat fokozatosan réssé alakítjuk. A hang frekvenciaszerkezetét a
zárképzés helye határozza meg.
13. ábra-Zár-réshangok
27
Dzs
A dzs (alveoláris) zöngés-zörejes gerjesztésű zár-rés hang, amely zöngeszakaszra és
zöngés-zörejes gerjesztésű zárfeloldódási részre (rés) bontható. A zönge időtartama hosszú,
80-100 ms, a zárfeloldódásé 40-60 ms CV kapcsolatban. A hangsorvégi dzs a magyarban csak
a bridzs szóban található meg. A zönge a d-jéhez hasonló szerkezetű, intenzitása 15-25 dB-lel
alacsonyabb, mint a követő magánhangzóé. A zár feloldódásakor az intenzitás lassan
növekszik, a hangban a zörej válik dominánssá. A hang ezután simán beleolvad a hozzá
csatlakozó magánhangzó kezdeti szakaszába. A résszakaszban az s hang zörejes eleméhez
hasonló szerkezetű hang keletkezik. A dzs hang utáni magánhangzóban is ugyanolyan
formánsmozgások zajlanak le, mint amilyenek a zs-hez való kapcsolódásnál.
Dz
A dz (dentális) zöngés-zörejes gerjesztésű zár-rés hang, amely zöngeszakaszra és
zöngés-zörejes gerjesztésű zárfeloldódási részre bontható. A zönge időtartama hosszú, 120-
140 ms, a zárfeloldódásé 50-80 ms hangsorbelseji helyzetben. A hangsorvégi dz elemei még
ennél is lényegesen hosszabbak lehetnek. A zönge a d-jéhez hasonló szerkezetű, intenzitása
15-25 dB-lel alacsonyabb, mint a követő magánhangzóé. A zár feloldódásakor az intenzitás
lassan növekszik és a hang ezután beleolvad a magánhangzó kezdeti szakaszába. A
résszakaszban a z zöngés-zörejes eleméhez hasonló szerkezetű hang keletkezik. A dz hang
utáni magánhangzóban is ugyanolyan formánsmozgások zajlanak le, mint amilyenek a z-hez
való kapcsolódásnál.
Réshangok
A magyarban nyolcféle réshangnak van betűjele: v, f, z, sz, zs, s, j, h. Ezeken túl a
kiejtésben megjelennek a j hang zöngétlen változata és a h különböző változatai is. A
réshangok mind egyszerű szerkezetűek, időben nem tagolódnak. Gerjesztésük lehet zöngés,
zörejes és kevert. A réshangok képzésekor a szájüreg adott helyén képezzük a rést. A réshang
hangzását a résképzés helye és a rés formája határozza meg.
28
14. ábra-Réshangok
S
Az s (alveoláris) zöngétlen réshang, egyszerű szerkezetű, időben nem tagolódik,
folyamatosan is ejthető. Az s hang intenzitásszerkezet szempontjából három részből áll:
kezdeti szakasz, középső, intenzív rész és a hang lecsengési fázisa, amiben az intenzitása
szinte nullára csökken. A hang középső részében az intenzitás 10-15 dB-lel kisebb, mint a
hanghoz csatlakozó magánhangzóé. Az s-hez kapcsolódó magánhangzó hirtelen
intenzitásnövekedéssel éri el a normál intenzitásszintjét. A hosszú s hang közel kétszer akkora
időtartamú, mint a rövid.
Az s hang zörejelemei az 1800-6500 Hz-es sávban találhatók. Ebben a sávban
általában egy intenzív zörejgóc alakul ki: sZ1: 2500-3500 Hz. A Z1 zörejkomponensének alsó
határa kissé mozog a hanghoz csatlakozó magánhangzó F2-jének a függvényében, hiszen az s
képzése közben már erre a magánhangzóra artikulálunk. Tehát az s kissé sötétebb hangzású a
só hangkapcsolatban, mint a sí-ben. Az s hangot követő magánhangzó formánsaiban
kismértékű mozgás van jelen az átmeneti fázisban.
Z
A z (dentialveoláris) zöngés-zörejes (kevert gerjesztésű) réshang. A hang egyszerű
szerkezetű, időben nem tagolódik, folyamatosan is ejthető. A z hang 10-20 dB-lel kisebb
intenzitású, mint a hozzá kapcsolódó magánhangzó. A hang folyamatosan beleolvad a hozzá
kapcsolódó magánhangzó kezdeti szakaszába.
A z hang, meghatározott formánsszerkezettel rendelkezik, ehhez keverednek a
zörejből adódó frekvenciakomponensek. A zöngés elem formánsai: zF1: 250-300 Hz ; zF2:
1300-1800 Hz ; zF3: 2600 Hz. A zF2 frekvenciaértéke (a megadott sávon belül) enyhén
követi VF2-jének értékét. Ha VF2 alacsony, akkor zF2 is alacsony és ellenkezőleg. A z hang
zörejkomponense ugyanolyan frekvenciaszerkezetű, mint az sz. A z-hez kapcsolódó
magánhangzó átmeneti fázisában a formánsok hajlanak a z formánsaihoz. A koartikulációs
29
illeszkedés tehát kölcsönös, de a nagyobb formánsmozgások inkább a magánhangzóban
jönnek létre.
V
Az v (labiodentális) zöngés réshang. A hang egyszerű szerkezetű, időben nem
tagolódik, folyamatosan is ejthető. A v hang 10-15 dB-lel kisebb intenzitású, mint a hozzá
kapcsolódó magánhangzó. A hang folyamatosan beleolvad a magánhangzó kezdeti
szakaszába. A v hang zöngés eleméhez zörej is hozzáadódhat. Ez főleg hangsorvégi
helyzetben fordul elő. A zörej hasonló frekvenciaszerkezetű, mint az f hang, csak kisebb
intenzitású.
A v hang, meghatározott formánsszerkezettel rendelkezik. Formánsai: vF1: 250-300
Hz; vF2: 800-1500 Hz; vF3: 2500 Hz. A vF2 mozog a hozzá kapcsolódó magánhangzó
függvényében: ha VF2 kisebb, mint 1300 Hz, akkor vF2 800 Hz körüli; ha VF2 1300 Hz és
1500 Hz közötti, akkor vF2 értékét a (VF2 1500)/2 Hz közelítő képlettel számíthatjuk ki; ha
VF2 nagyobb, mint 1800 Hz, akkor vF2 1500 Hz körüli.
Zs
A zs (alveoláris) zöngés-zörejes (kevert gerjesztésű) réshang. A hang egyszerű
szerkezetű, időben nem tagolódik, folyamatosan is ejthető, mintegy 10-15 dB-lel kisebb
intenzitású, mint a hozzá kapcsolódó magánhangzó. A zs hang folyamatosan beleolvad a
magánhangzó kezdeti szakaszába.
A zs hang zöngés eleme meghatározott formánsszerkezettel rendelkezik, ehhez
keverednek a zörejből adódó frekvenciakomponensek. A formánsok értékei: zF1: 250-300
Hz; zF2: 1600-2100 Hz; zF3: 2400-2600 Hz. A zsF2 értéke (a megadott sávon belül) enyhén
követi VF2-jének értékét. Ha VF2 alacsony, akkor zsF2 is alacsony és ellenkezőleg. A hang
zörejkomponense ugyanolyan frekvenciaszerkezetű, mint az s hangé. A csatlakozó
magánhangzó átmeneti fázisában a formánsok hajlanak a zs formánsaihoz. A koartikulációs
illeszkedés tehát kölcsönös, de a formánsmozgások inkább a magánhangzóban jönnek létre.
Nazálisok
A magyarban háromféle nazális hangnak van betűjele:m, n, ny. Az ng, nk és mv, mf
betűkapcsolatok ejtésekor az n és m képzési helye megváltozik. Ez a hangot is kissé
megváltoztatja. A nazális hangok ejtésekor az orrüreg nyitott, a szájüregben viszont akadályt
képezünk. Ezért ezeket a hangokat félzárhangnak is nevezhetjük. A zárképzés az artikulációs
30
csatornában mindegyik hangnál más ponton jön létre. Az m, mv, n, ng egyszerű szerkezetű,
folyamatosan ejthető. Az ny hang összetett szerkezetű, nazális zöngéből és zárfeloldódásból
áll.
15. ábra-Nazális hangok
A felsorolásban kiemelt mássalhangzók fontos szerep töltenek be a beszédhang
feldolgozásában a feladat elvégzése során. Mind a zöngéses hangok, mind a frikatívák olyan
hangok, amelyek képzésekor sokszor nem elég a vizuális megjelenítés a hallássérültek
számára, a zöngés és zöngétlen párok sokszor alig különböztethetőek meg. Ezen hangok
frekvenciatartománybeli értékeit kihasználva vibrotaktilis kijelzésre használhatjuk fel ezen
hangokat.
Taktilis kijelző
A taktilis kijelzés
A tapintás alapú információ közlés a tapintó szervek ingerlésével, az úgynevezett
taktilis kijelzőkkel lehetséges.
A számítógépes kijelzők nagy csoportját alkotják a tapintható kijelzők, melyek
segítségével a látás-, illetve halláskárosult emberek képesek a külvilágból származó, hozzájuk
érkező információkat kezelni. Legáltalánosabb alkalmazása a vakok számára készült
kijelzőknél van, de már készítenek egyéb segédeszközöket is ilyen berendezésekkel ellátva
halláskárosult személyek számára is. Taktilis kijelzőket alkalmaznak még a valós világ
modellezésére készülő különféle virtuális berendezéseknél is.
A vibrotaktilis kijelzők alapelve a következő: a beérkező információt, ami lehet vizuális vagy
hang információ, átalakítja megadott paraméterek felhasználásával mechanikai ingerekké.
Két nagy csoportra oszthatjuk fel őket, időben statikus és időben dinamikus kijelzők
csoportjára. Az elsőbe tartoznak a Braille írást megjelenítő eszközök, a másodikba az egyre
31
inkább elterjedőben lévő beszéd-átalakító eszközök és virtuális valóság megjelenítő
berendezések. Másik csoportosíthatóság, ha azt vesszük figyelembe, hogy a használó
mozgatja az ujját a szerkezeten, vagy a szerkezet fix ponton rá van erősítve a felhasználóra, és
úgy közvetíti a mechanikai ingereket. A cél azonban mindegyiknél, mindkét csoportnál ugyan
az: minél érthetőbb rezgési formákat állítsanak elő, több paraméter kijelzésére legyenek
alkalmasak, kis fogyasztással rendelkezzenek, könnyen kezelhetőek legyenek, bizonyos
fajtáknál a real-time megjelenítés, a méret és az univerzális alkalmazhatóság is fontos
szempont.
16. ábra-Taktilis kijelzőtípus 1
17. ábra-Taktilis kijelzőtípus 2
18. ábra-Taktilis kijelzőtípus 3
19. ábra-Taktilis kijelzőtípus 4
A tapitás felhasználása
A tapintást, mint érzékelést használja ki ez a kijelzőfajta a bőrben elhelyezkedő
érzőreceptorokat ingerlik. A taktilis kijelzők függetlenül vezérelhető mozgató
(aktuátor) elemek, amelyek a bőr felületét általában merőleges erőhatásnak teszik ki.
32
A kijelzés frekvenciája, dinamikája, amplitúdója, nyomása, a pontok távolsága határozza meg
az átvihető információ jellegét és mennyiségét.
20. ábra-Vibrotaktilis ingerlés
Mint már az a dolgozat elején bemutatásra került, a legérzékenyebb taktilis felvevő
pont az ujjak vége. Az ujjak végén 1-2 mm távolságra lévő rezgő pontok jól elkülöníthetők
függetlenül attól, hogy a felületre merőleges vagy oldalirányú a gerjesztés.
Egy ponton vibrálásként érzékelhető legmagasabb frekvencia 1000Hz, a
legérzékenyebb a bőr a kb 250Hz frekvenciájú rezgésekre. Egy ujjbegy legfeljebb 3,5 mm
elmozdulást visel el, a fájdalomküszöb 1,75 mm átmérőjű tüskénél 1,3 MPa. Az érzékelhető
legkisebb elmozdulás 2μm abban az esetben, ha az ujj elmozgatását nem engedjük meg.
Hiba! A hivatkozási forrás nem található.
Moy és szerzőtársai kimutatták, hogy ideális taktilis kijelző 500 mN/mm2 csúcsnyomással, 4
mm lökettel, 50 Hz sávszélességgel, a kijelzők legalább 1 mm-es távolságával jellemezhető.
A különféle kijelző technikák a központi vezérlő megoldásokban térnek el. Irodalmi
források alapján a különböző fizikai elveken működő taktilis kijelzők jellemzőit az 1. táblázat
tartalmazza. Az ott felsorolt megoldások közül, itt csak a legelterjedtebb megoldások
kerülnek rövid bemutatásra.
Taktilis kijelzőtípusok
Termoelektrikus stimulátor
A mozgató energiát a mozgatóegységben fellépő termofeszült-ségkülönbség adja. A
termoáramot felhasználó berendezés kis frekvenciájú rezgést tud előállítani, továbbá a rezgés
útja és az ingerelt felületre kifejtett nyomás is viszonylag alacsony értékeket vesz fel. Kis
energia igény jellemző rá, ami a teljesítményt is tükrözi.
Elektromágneses stimulátor
A szerkezetben az elektromágnes a motor rotációs mozgását lineáris mozgássá alakítja át.
Ennél a megoldásnál a széles a megvalósítható rezgetési frekvencia. A stimulátor mozgási
33
tartománya akár 10 mm is lehet. Nincs meghatározva a stimulátor mérettartománya és magas
a felületre gyakorolt nyomás értéke is.
Pneumatikus stimulátor
Alacsony működési frekvencia előállítására alkalmas megoldás. A szerkezet dugattyú elven
működő légszelepes megvalósítást alkalmaz. Az alacsony frekvencia ellenére viszonylag
erősebb nyomás éték érhető el ezzel a szerkezet-típussal.
Piezelektromos stimulátor
Működési elve a piezoeffektus. A fordított piezoelektromosságot felhasználva, ha a
piezoelektromos kristályra elektromos feszültséget adunk, akkor az elektromos térerősség
irányától függően összehúzódik, vagy megnyúlik. Ezt felhasználva a kristálycsíkokra szerelt
stimuláló tüskék a váltakozó feszültségre rezegni kezdenek.
A rendszer tervezése
Az áttanulmányozott technológiák közül kettő lett kiválasztva, melyek alkalmasak kis
energia-befektetés mellett a kívánt paraméterek elérésére. A kiválasztott típusoknál, a
piezokristályos és elektromágneses megoldásoknál először is azt kellett megvizsgálni, hogy
melyik képes olyan amplitúdójú rezgés előállítására, amely az ember számára használható
értékeknek felel meg, és a fentebb meghatározott paraméterek értékei körül mozognak.
A National Instruments által gyártott Elvis berendezésén lett megvalósítva a
piezokristály szerkezet tesztelése. Kis méretben és alacsony energia felhasználás mellett
megvalósítható volt a Piezzó eletromos hatás felhasználásával létrehozott stimuláció. Ebben
az esetben viszont a feljebb említésre került ideális paraméterek elérés csak 100V
nagyságrendjébe eső meghajtó feszültséggel hozhatók létre.
34
21. ábra-Piezokristályos model tesztelés 1.
22. ábra--Piezokristályos model tesztelés 2.
A méret és energiafelhasználási követelmények alapján lehetséges még az
elektromágnesen hatás felhasználásával létrehozott stimuláció, mely valamivel magasabb
súlyt eredményez ugyan, de sokkal egyszerűbb kivitelt tesz lehetővé. Kísérletek alapján
kiválasztott eljárás az elektromágneses erőhatás kihasználásán alapul, álló állandó mágnest,
álló elektromágnest és kis tömegű mozgó horgonyt tartalmaz.
23. ábra Elektromágneses elven működő
stimulátor
24. ábra Taktilis kijelző
Az elektromágneses elven működő stimulátor szerinti megvalósításon végzett mérések
alapján az elrendezés kis energiafelhasználás mellet alkalmas a kívánt hatás, azaz a kéz
különböző pontjainak érzékelhető ingerlésére. A szerkezet a beszédhang tulajdonságainak
felhasználásával több paraméter kijelzésére kell, hogy alkalmas legyen, így szükséges volt
olyan modell elkészítése, melyben azt lehetett megvizsgálni, hogy milyen hangátalakítások
menjenek végbe a kívánt eredmény eléréséhez.
35
Az elkészített modell
Az elkészített és kipróbált stimulátor vezérlésére egy számítógépes környezetben
felépített szimuláció szolgál. A szimuláció a környezetből érkező hanghullámok digitalizálása
után a hang jellemzőinek kinyerését valamint a stimulátor vezérlését végzi. Az emberi
beszédhang két paramétere lett kiválasztva a mechanikai megjelenítésre: a mássalhangzók
kétféle típusa, a zöngés hangok és a frikatív hangok. A hangképzés ennél a két típusnál
vizuálisan nem mindig határozható meg könnyedén, így esett a választás ezekre a
beszédjellemzőkre.
A zöngés hangok frekvenciatartománya 200 – 300 Hz közti érték, a frikatív hangok
ennél szélesebb frekvenciaspektrummal rendelkeznek, az 1000 Hz-től 3500 Hz-ig terjedő
tartománya esnek bele leginkább. Az első lépés a vezérlés megvalósításánál az analóg jel
digitalizálása. Így valósítható meg a kívánt frekvenciaértékek kiszűrése a 0-5000 Hz-ig
terjedő emberi beszédjelből. A kívánt szűrt értékek előállítása után frekvenciatartomány
modulációt kellett alkalmazni, mert míg a zöngés hangok frekvencia értékei a legérezhetőbb
rezgési tartományba esnek, addig a frikatív hangok ötször, hatszor magasabb értékekkel
rendelkeznek. A megfelelő moduláció alkalmazása után a jel visszaalakítását kell alkalmazni,
olyan formában, hogy, a két különböző paraméter megjelenítése külön-külön jelenik meg
ugyanabban az időben a vibrotaktilis szerkezeten. Erre a megoldásra a sztereo hangcsatorna
tökéletesen elegendő, így egy egyszerű modulációval a kívánt jel a csatorna egyik, illetve
másik oldalába vezérelhető. Ilyen formában tökéletesen adja vissza a taktilis kijelző a
megjelenítésre szánt beszédhangot.
Számítógépes szimuláció
Az elkészült és kipróbált stimulátor vezérlésére egy számítógépes környezetben
felépített szimuláció szolgál. A szimuláció a környezetből érkező hanghullámok digitalizálása
után a hang jellemzőinek kinyerését valamint a stimulátor vezérlését végzi. A kialakított
számítógépes rendszer blokkvázlata a 25. ábrán látható. A rendszerben a beszélő arcáról
képet és a hangját felhasználva készítünk egy lejátszható videókódolt állományt mely a
sztereó hangcsatornában a normál hang helyett a taktilis kijelző vezérlését tartalmazza, és így
lehetőséget teremt arra, hogy könnyen gyorsan tesztelhető legyen az algoritmus.
36
25. ábra-Számítógépes szimláció blokkvázlata
A számítógépes szimuláció megvalósítását Matlab programkörnyezetben végeztem,
mely alkalmas az audiófájlok kezelésére is. A szűrők megvalósításához a programhoz tartozó
Filter Designe Toolbox-t használtam, mely előre definiált algoritmussal, a kívánt szűrési
paraméterek megadásával végzi el a szűrést.
26. ábra-Matlab progrma és a Filter Designe Toolbox
37
A szűrés elvégzése után a magas frekvenciatartományba eső jelet a kívánt 200-300 Hz
közötti frekvenciatartományra kell transzformálni, ami a Hilbert transzformációval valósítható
meg.
A Hilbert-transzformáció nem más, mint az 1 1π⋅t függvénnyel való konvolúció, ami
Fourier-transzformált tartományban - j sgn(f)-fel való szorzást jelent. Összefoglalva:
F − − =1 1 1( sgn( ) )j ftπ a Hilbert transzformáció súlyfüggvénye,
∫+∞
∞− −= τ
ττ
πd
tsts )(1)}({H
a Hilbert-transzformáció konvolúciós integrálja.
S(f)
Sekv(f)
f-B-B
12 0S f fekv ( )−1
2 0S f fekv* ( ( ))− +
f
Re{}Im{}
f0-B f0+ Bf0 f0-f0-B -f0+ B 27. ábra-A jel és alapsávi ekvivalens spektruma
A 27. ábra alapján jól látható, hogy a S f S f j j f S f+ = + −( ) ( ) ( sgn( ) ) ( ) szerint definiált pozitív frekvenciájú spektrum az alapsávi ekvivalens spektrumának
egyszerű eltoltja (A - j sgn(f) a Hilbert-transzformálás átviteli függvénye), azaz:
S f S f fS f S f f
ekv
ekv
+
+
= −= +
( ) ( )( ) ( )
0
0
Innen, felhasználva hogy a frekvenciatartománybeli eltolás időtartományban egy
exponenciális taggal való szorzást jelent:
s t s t eekvj f t
+ =( ) ( ) 2 0π,
s t s t eekvj f t( ) ( )= +
− 2 0π,
azaz az s+(t) jel előállítható az eredeti jelből a Hilbert-transzformáció segítségével, ebből
pedig egy e j f t− 2 0π -vel való szorzással az alapsávi ekvivalenshez jutunk.
38
Ezt a 90 fokos késleltetésű algoritmust nevezik Hilbert transzformátornak. A
szoftverekben kétféle Hilbert transzformátorral találkozhatunk: az egyik jelfolyam típusú
szűrő, a másik implementációban pedig a Fourier transzformált együtthatóit módosítják.
A megfelelő mátrix műveletek elvégzése után, az elkészült jel adatokat egy hangfáljba írom
vissza.
Példamondat
Klári mindig ráugrik a moziban, amikor jönnek a cápák.
28. ábra-Az eredeti és a modulált jel jelalakja
29. ábra-Eredeti hang frekvenciatartománya
30. ábra-Modulált hang frekvenciatartománya
39
31. ábra-Az eredeti hangfálj jangképe
32. ábra-A modulált hangfálj hangképe
40
Programkód
function vege(input,output); Függvény meghívás, bemeneti és kimeneti
hanffájlok megadás,
load low.mat Aluláteresztő szűrő meghívása
load band.mat Sávszűrő meghívása
Y = wavread(input); A megadott hangfájl beolvasása
Y = Y*6; A beolvasott beszédhang felerősítése, amplitúdó
moduláció
t=(1:length(Y))'/length(Y); Időtényező deklarálása
z=cos(2000*2*pi*t); A frekvenciaeltoláshoz szüksége jel deklarálása
B = filter(Hd_low,Y); A beolvasott fájl aluláteresztő szűrése
B = B*4; Az eredmény erősítése
B(:,2) = []; Az eredmény egycstornásssá alakítása
A = filter(Hd_band,Y); A beolvasott fájl sávszűrése
A(:, 2) = []; Az eredmény egycstornásssá alakítása
x2=real(hilbert(A)./hilbert(z)); A sávszűrt eredmény Hilbert-transzformációja
yn = x2*2; Az eredmény erősítése
X = zeros(length(Y),2); Egy üres mátrix deklarálása, 2 x az eredeti hagfájl hossz
X(:,1) = B; A mátrix egyik oszlopának feltöltése az aluláteresztő
szűrővel késztett eredménnyel
X(:,2) = yn; A mátrix másik oszlopának feltöltése az sávszűrővel
késztett eredménnyel
wavwrite(X,16000,output); A végeredmény kiíratása hagfájlba
subplot(2,1,1); A kezdeti fájl hangképének és a megszűrt fájl
plot(Y); hangképének kirajzoltatása
xlabel('time(s)');
ylabel('relatív hangteljesítmény(db)');
title('Original Signal');
subplot(2,1,2);
plot(X);
xlabel('time(s)');
ylabel('relatív hangteljesítmény(db)');
title('Modulated Signal');
41
33. ábra-A számítógépes szimulációs rendszer
A számítógépes szimuláció során elkészült állományok bármely számítógépen
lejátszhatók és az taktilis kijelzőt a hangszóró kimenetre csatlakoztatva felhasználható.
Tapasztalatok a taktilis kijelző használatáról
A taktilis kijelző által szolgáltatott információk abban az esetben segítik a
beszédmegértésben a felhasználót, ha az megtanulta a taktilis jelek értelmezését. Siketek
esetében nem természetes a zöngés/zöngétlen fogalom ezért ennek, illetve az ebből képzett
taktilisan átvitt jellemző megtapasztalása csak tanulás után segíti a szájról olvasott beszéd
megértését.
Továbbfejlesztési lehetőségek
Kísérleti lehetőségeket ad még további folyamatok beiktatása a jelfeldolgozásba. Tisztább
és érthetőbb taktilis impulzust lehet talán elérni a nullátmenet detekció alkalmazásával. Más
szűrési feltételek felhasználásával szintén a tisztább információközlést lehet javítani.
A taktilis kijelzővel végzett kísérletek alapján az elrendezés és algoritmus alkalmas arra,
hogy önálló megjelenési formában elkészüljön. A taktilis kijelző elkészítésnél hármas célt
határoztunk meg:
• Legyen egy számítógépes perifériaként valódi hang kimenetről működő változat;
42
• Legyen összekapcsolható mobil telefonnnal;
• Legyen önálló mikrofonnal rendelkező telepes működtetésű változat.
34. ábra Tervezett taktilis kijelző logikai elrendezése
43
Irodalomjegyzék Robert Sekuler – Randolph Blake: Észlelés, Osiris Kiadó, Budapest, 2000 Szentágothai János – Réthelyi Miklós: Funkcionális anatómia III., Medicina,Budapest,2002 Az emberi test. Medicina - Láng Kiadó, Budapest Matematikai kézikönyv, Typotex Kiadó, Budapest, 2002 Gordos - Takács: Digitális beszédfeldolgozás, Mûszaki könyvkiadó, Budapest 1983. MTA Nyelvtudományi Intézet Fonetikai kutatólaboratóriuma :Magyar nyelvi eszédtechnológiai alapismeretekInterdiszciplináris, multimédiás szakkönyv M. Jungmann, H. F. Schlaak :Miniaturised Electrostatic Tactile Display with High Structural Compliance, Institute of Electromechanical Design / Darmstadt University of Technology Vincent Hayward Juan Manuel Cruz-Hern´andez: TACTILE DISPLAY DEVICE USING DISTRIBUTED LATERAL SKIN STRETCH, Department of Electrical Engineering and Center for Intelligent Machines, McGill University I.Sarakoglou N.Tsagarakis D.G.Caldwell :A Portable Fingertip Tactile Feedback Array –Transmission System Reliability and Modelling, Centre for Advanced Robotics Research, Department of Computing, Science and Engineering, Salford University http://www.mathworks.com/ http://www.mathworks.com/matlabcentral/fileexchange/loadCategory.do