ANÁLISIS ACÚSTICO DE LA VOZ NORMAL Y PATOLÓGICA UTILIZANDO DOS SISTEMAS DIFERENTES- ANAGRAF y...

Disponible en: http://www.redalyc.org/articulo.oa?id=18026361002

Red de Revistas Científicas de América Latina, el Caribe, España y Portugal

Sistema de Información Científica

ELISEI, NATALIA GABRIELA

ANÁLISIS ACÚSTICO DE LA VOZ NORMAL Y PATOLÓGICA UTILIZANDO DOS SISTEMAS DIFERENTES:

ANAGRAF y PRAAT

Interdisciplinaria, vol. 29, núm. 2, 2012, pp. 339-357

Centro Interamericano de Investigaciones Psicológicas y Ciencias Afines

Buenos Aires, Argentina

¿Cómo citar? Número completo Más información del artículo Página de la revista

Interdisciplinaria,

ISSN (Versión impresa): 0325-8203

[email protected]

Centro Interamericano de Investigaciones

Psicológicas y Ciencias Afines

Argentina

www.redalyc.orgProyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

http://www.redalyc.org

http://www.redalyc.org/comocitar.oa?id=18026361002

http://www.redalyc.org/fasciculo.oa?id=180&numero=26361

http://www.redalyc.org/articulo.oa?id=18026361002

http://www.redalyc.org/revista.oa?id=180

http://www.redalyc.org/articulo.oa?id=18026361002



http://www.redalyc.org


RESUMENLa necesidad de una evaluación instrumental

y objetiva de la calidad de voz se refleja en elcreciente número de métodos de análisis acús-ticos desarrollados para el diagnóstico clínico yla investigación.

En el trabajo que se informa se realizaronaná lisis acústicos utilizando dos programas di-ferentes: PRAAT y ANAGRAF. Ambos sistemasson programas informáticos de uso común enLatinoamérica, en contextos clínicos y de in-ves tigación, para detectar y caracterizar el habla,la voz y los desórdenes vocales. El propósito fuecomparar los resultados obtenidos con un con-junto de mediciones acústicas, muchas de lascuales se definen de manera similar en ambosprogramas y analizar si se puede distinguir clí-nicamente entre la normalidad y la patología ensus diferentes niveles de severidad. Un total de776 muestras de voz correspondientes a 4 repe-ticiones de la vocal /a/ de 194 hablantes de es-pañol en Buenos Aires se midieron utilizando losparámetros disponibles como lo son: la fre-cuencia fundamental, jitter, shimmer y harmo-nic-to-noise ratio. Los resultados muestran va-lores similares de frecuencia fundamental (F0)para ambos programas. Sin embargo, los valoresde jitter, shimmer y harmonic-to-noise ratio(HNR) fueron significativamente menores me-

didos con PRAAT y resultaron superiores utili-zando ANAGRAF.

La confiabilidad de los valores obtenidos conambos programas se redujo significativamentecon el aumento de las irregularidades en la señal.Por lo tanto, parece importante establecer nor-mas para las voces normales y patológicas conel fin de guiar o dar un paso más en la validez yconfiabilidad de las prácticas profesionales.Palabras clave: Análisis acústicos; Análisis devoz normal y patológica; PRAAT; ANAGRAF.

ABSTRACTThe need for instrumental objective assessment

of voice quality is reflected in the increasingnumber of acoustic analysismethods developed forclinical diagnosis and as research outcome in thearea. Acoustics measures of vocal productionsreceived much attention in the literature and avariety of commercial packages are available.Those systems packages are presented as objectivetools with apparently standardized, well-designedmeasurement protocols and acceptably low inci -dence of technical problems. The fact of using thesame labels for similar measurement output likemean jitter or mean shimmer induce to think thatresults from different programs are comparable.

INTERDISCIPLINARIA, 2012, 29, 2, 339-357 339

ANÁLISIS ACÚSTICO DE LA VOZ NORMAL Y PATOLÓGICA UTILIZANDO DOS SISTEMASDIFERENTES: ANAGRAF Y PRAAT

ACOUSTIC ANALYSIS OF NORMAL AND PATHOLOGICAL VOICES USING TWO DIFFERENTSYSTEMS: ANAGRAF AND PRAAT

NATALIA GABRIELA ELISEI*

*Licenciada Fonoaudióloga. Becaria de Doctorado del Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). E-Mail: [email protected]

Grecia 3644, 3er Piso, Dpto. B, (1429) Ciudad Autónoma de Buenos Aires, República Argentina.

However, there is no standardization of tech -nique methodology and considerable variability isobserved about which acoustic parameters must bemeasured. Furthermore, product documentationoften makes it difficult to know how a particularsystem actually produces its measurements. Littleformal information is available about the actualcomparability of measures from different analysispackages.

In this study, acoustic analysis was performedusing two different programs: PRAAT and ANA -GRAF. Both systems are computer programscommon ly used in Latin America, in clinical andresearch to detect and characterize speech and voicedisorders. PRAAT, was designed by Boersma andWeenink (2009) and ANAGRAF is a national soft -ware designed by Gurlekian (1997).

The purpose of this work was to compare theresults obtained by a set of acoustic parameters,many of which are defined similarly in bothprograms, and analyze whether it can distinguishclinically between normal and pathological voiceswithin different severity levels.

A total of 776 voice samples corresponding to4 repetitions of the vowel /a/ of 194 speakers ofSpanish in Buenos Aires were measured using theavailable parameters such as: the fundamentalfrequency, jitter, shimmer, and noise-to harmonicratio. The LilliefordsTest, with a significance levelof 5%, was used to verify the normal distribution ofthe results of each measurement. The parameterswith normal distribution had their means comparedto the standard measurements proposed by theprogram using the t test (significance level of 5%).

General results separated by sex are reported.The findings of analyzed voice samples are showedby definitions for mean, standard deviation, andthresholds of normal for each parameter, whichhelps the clinician to immediately assess thefindings for a particular patient. The test-retestreliability in each pair of measures was calculated.

For both programs the results show similarvalues of fundamental frequency (F0). However,the values of jitter, shimmer and harmonic-to-noiseratio (HNR) were significantly lower measured byPRAAT, and higher using ANAGRAF in relationwhich the default results proposed by each system.The empirical evidence shows that if followed thedefault values and thresholds of each system, thediagnostic accuracy might be questioned by

considering both cases as false positives or falsenegatives.

Results demonstrate that the reliability of thevalues obtained by both programs was significantlyreduced with the increase of irregularities in thesignal. Parameters related with shimmer were morereliable than parameters related with jitter.

For the normal data, r Pearson correlationsranged from .72 (ANAGRAF) to .87 (PRAAT) formeasures of jitter, with lower correlations amongmeasures of shimmer .27 (ANAGRAF) to .80(PRAAT) and noise measures .55 (ANAGRAF) to.87 (PRAAT). The large differences found betweenthe measurements from the systems imply that theaccuracy of the measurements are questionable,especially for severely pathological samples.

Therefore, it seems important to establishnormal and pathological voice standards norms forSpanish in Buenos Aires to take a step in thevalidity and reliability of the professional practices.Future research be aimed at establishing differ -ences between vowels in addition to sex andsystem used.Key words: Acoustic analysis; Normal andpathological voice analysis; PRAAT; ANAGRAF.

INTRODUCCIÓNLa voz humana constituye el medio más

rápido y sencillo para comunicarse. Con eldesarrollo de las tecnologías en telecomuni-caciones ha aumentado considerablementeel uso de la voz así como también se han in-crementado los desórdenes vocales, que ocu-rren en un 3 a 9% de la población.

Desafortunadamente, a pesar de la po-tencia con la que se pueden computar los da-tos, no parece ser completamente posibleanalizar la voz humana objetivamente y co-nocer más profundamente cuáles son losprocesos que gobiernan la producción de lavoz. Aunque las técnicas modernas puedenanalizar la voz, aún existen temas conflicti-vos e irresueltos.

Elisei

340 INTERDISCIPLINARIA, 2012, 29, 2, 339-357

Cuando se intenta detectar y caracterizarlas voces patológicas en la clínica, el obje-tivo es documentar sus cambios signi fi-cativos, es decir, aquellos que no resultendespreciables ni producto del azar. Estoscambios pueden documentarse a través de laevaluación perceptual visual y/o auditiva yel análisis acústico de la señal. La evalua-ción perceptual visual identifica las pa to- logías laríngeas mediante la observacióndirecta de las cuerdas vocales (fibrolarin -gos copía, videoestroboscopía laríngea, etc.).Este tipo de exploración subjetiva tie ne múl-tiples desventajas, entre las que se en cuen- tran su alto costo, la duración de la propiaexploración y el hecho de tratarse de técni-cas invasivas.

El análisis perceptual auditivo está sien -do revisado y cuestionado actualmente en laliteratura universal. La selección y la defi-nición de escalas perceptuales auditivas hansido controvertidas y no siempre comunes atodos los especialistas en voz.

En este contexto, el uso de las medicio-nes acústicas como estudio de diagnósticocomplementario de voces patológicas en elámbito clínico se ha incrementado hastaconvertirse en rutinas. El análisis acústicoofrece ventajas ya conocidas, no es costoso,es fácil de usar y no es invasivo. El mayorproblema del uso de medidas acústicas es lainterpretación de las mismas. Al utilizarmé todos de análisis acústico se miden deforma computarizada las propiedades espe-cíficas de una forma de onda de señal devoz, semejante a la producida por el pa -ciente, pero modelada por una teoría. Laaplicación de los diferentes métodos exigeentender y visibilizar los principios que losoperan. Según Baken y Orlikoff (2000), seha sido muy condescendiente y no se hancuestionado los procedimientos o los su -puestos, indocumentados muchas veces, enlos que se basan los sistemas de análisis quese compran y se utilizan. Estos autores su -gieren ser más sofisticados y más escép- ticos en favor de un diagnóstico más pre-ciso.

Con este propósito se realizaron compa-raciones entre sistemas (Bielamowicz,

Kreiman, Gerratt, Dauer & Berke, 1993;Boersma, 2009; Burris, 2011; Godino-Llo-rente, Osma-Ruiz, Saenz-Lechon, Cobeta-Marco, Gonzalez-Herranz & Ramirez-Cal -vo, 2008; Oguz, Kilic & Safak, 2011) quemostraron la existencia de variaciones en laprecisión con la que los diferentes progra-mas determinan el período y la amplitud deuna señal vocal (estrategias de voicing). Losvalores no son exactos ni comparables entresí, aunque algunos estudios establecieronrelaciones entre medidas (Boersma, 2009;Deliyskiy & Boersma, 1993).

Este artículo propone describir, analizar ydiscutir los valores de las medidas acústicascalculadas por dos sistemas de análisis obje-tivos y muy conocidos, uno nacional y otroextranjero, como son ANAGRAF (Gurlekian,1997, 2001) y PRAAT (Boersma, 2009).

Específicamente, el objetivo fue estudiaren hablantes del español de Buenos Aires, losvalores de tendencia central y dispersión queasumen voces normales y patológicas medi-dos con ambos sistemas e interpretar suajuste con los valores estándares propuestospor defecto por los mismos programas. Fi-nalmente, se pretende establecer valoresguías, que constituyan un aporte a la prácticaclínica diaria, para la voz normal y patoló-gica según su grado de severidad, conside-rando la confiabilidad propia de cada me di-ción.

MÉTODO

MATERIALES Y PROCEDIMIENTO

Para el análisis acústico lineal tradicio-nal se utilizaron las vocales /a/ del españolde Buenos Aires registradas en la Base deDatos de Alteraciones de la Voz y el Habla(Elisei, 2011) integrada por las emisiones de66 hablantes normales (H) y 128 hablantescon patología vocal (P).

Se analizaron 194 sujetos hablantes delEspañol de Buenos Aires, de los cuales 78(40.2%) eran hombres y 116 (59.8%), mu-jeres. La media de edad fue igual a 36.35años con una desviación estándar de 16.059.

Análisis acústico de la voz normal y patológica


Las voces de individuos normales pertene-cen a 33 hombres y 33 mujeres, con edadespromedio de 27.38 ± 7.9 y 26.78 ± 7.9 años,respectivamente (se indica el valor medio ±el desvío estándar). El conjunto de voces pa-tológicas contiene muestras de 45 hablantesmasculinos y 83 femeninos. El promedio deedad en este caso fue de 45.88 ± 22.02 y38.31 ± 15.68 años para el grupo de hablan-tes masculinos y femeninos, respectiva-mente.

Los diagnósticos etiológicos presentes enla base de datos son variados: lesiones es-tructurales mínimas, congestión por reflujogastroesofágico, papilomatosis, granulomas,hiperfunción, hiperplasia, queratosis, edemade cuerdas vocales, pólipos cordales, fona-ción ventricular, tejido de cicatrización, tem-blor vocal, estenosis laríngeas y parálisiscordales, entre otras.

El corpus empleado para este estudio in-cluyó 2.995 muestras vocales correspon-dientes a tres repeticiones de la vocal /a/ delEspañol de Buenos Aires, más una emisiónsostenida durante el tiempo máximo fona-torio de cada sujeto.

Previo al registro de sus voces, los parti-cipantes respondieron a un breve cuestiona-rio relacionado con factores de riesgo. Seinstruyó a los participantes para que pro-nunciaran en tres oportunidades la vocal /a/de manera sostenida (tiempo estimado: de 3a 5 segundos), a una intensidad y frecuenciaespontáneas.

Las emisiones fueron grabadas digital-mente en una computadora de escritorio uti-lizando una placa de sonido externa USBmarca M-Audio Firewire modelo 1410. Seutilizó un micrófono AGK D770, tipo diná-mico unidireccional cardioide, con un rangode frecuencia de 60 Hz-20 kHz, sensibilidadde 2,5 mV/Pa (-52 dBV) e impedancia de600 Ohm situado a 10 cm de la boca en unasala acústica y antecámara con nivel deruido de 35 dB y tiempo de reverberaciónmenor a 1 segundo. El material fue regis-trado con un nivel de calidad de 16 bits yuna frecuencia de muestreo de 44.100 mues-tras por segundo y no se utilizó ningún tipode compresión. Una vez que se tomaron las

muestras se editaron a través del programaSound Forge Versión 8.0b. Sólo el cuerpo dela señal se utilizó para el análisis acústico, loque se realizó manualmente. La edición decada sonido se realizó tomando el cuerpo dela emisión y desechando el ataque y la fila-tura de cada muestra.

Para analizar las señales vocálicas se em-pleó la funcionalidad del Voice Report dePRAAT Doing Phonetics by Computer, ver-sión 4.6.06 y de ANAGRAF versión V09.10con la función de reporte desarrollado ad-hoc en el Laboratorio de InvestigacionesSensoriales para analizar estos datos. Se mi-dieron y analizaron un total de 25 medicio-nes acústicas lineales tradicionales. Unaventaja comparativa de PRAAT es que per-mite a través de los scripts, realizar una se-cuencia de comandos para agilizar el análi-sis de muestras.

RESULTADOS

Los resultados comparativos se agrupanen dos secciones. La primera se refiere al es-tudio de los hablantes con voces normales entanto se describen los valores de las medidasacústicas para cada sistema y su relacióncon los valores umbrales o puntos de corteestándares configurados por defecto.

La segunda sección incluye en el análisisde la población de hablantes con voces pa-tológicas y describe, distinguiendo cada sis-tema, la confiabilidad de las medidas en fun-ción del grado de severidad.

SECCIÓN I. VALORES NORMALES

En este primer estudio se realizaron lascomparaciones de los resultados medidosen voces normales (de ahora en más, H) encada programa (PRAAT y ANAGRAF) conaquellos dados por defecto. Inicialmente seaplicó el test de Kolmogorov-Smirnov paracorroborar la distribución normal de los da-tos y luego el test t de Student para la vocal/a/ de hombres y mujeres del grupo H. Los

Elisei


resultados de estos procedimientos se resu-men en las tablas 1 y 2, se detallan y discu-ten considerando las medidas individual-men te.

MEDICIONES DE FRECUENCIA FUNDAMENTALEl cálculo preciso de la frecuencia fun-

damental (F0) de la señal de habla es un re-quisito indispensable para procesamientosposteriores. La evaluación de parámetros re-lacionados con la variación de la F0 depen -de fuertemente de que ésta haya sido esti-mada con el mínimo error posible.

Como se observa en la Tabla 1, la mediade la frecuencia fundamental (F0) medidacon PRAAT en la muestra de sujetos nor-males (H) es igual a 119 Hz (± 20) para losvarones y 207 Hz (± 24) para las mujeres,con importantes variaciones en ambos gru-pos.

La medición de frecuencia fundamentalen ANAGRAF ofrece tres posibilidades:f0_pr, fc_cp y f0_cc. El primero, (f0_pr) secalcula con un método de correlación(RAPT); el segundo se calcula con un mé-todo frecuencial (cepstral) y con el tercerose realiza un cálculo temporal: ciclo a ciclo.Este último es el menos confiable, pero elmás arriesgado en casos que los otros méto-dos no permitan calcular. Por ello, es la in-formada en el reporte de ANAGRAF. Eneste estudio sólo se midieron dos: F0_pr yF0_cc. En la Tabla 2 se observa que los va-lores obtenidos son semejantes a PRAATcuando se mide con f0_pr y presentan mayorvariación cuando se lo compara con f0_cc,confirmando así lo dicho anteriormente so-bre su menor confiabilidad.

Los resultados obtenidos con ambos pro-gramas concuerdan con lo que se esperabadebido a las diferencias entre sexos para to-dos los parámetros relacionados con la fre-cuencia fundamental, encontrándose mayorvariabilidad en el sexo femenino. El rangode valores para la frecuencia fundamental(F0) se extiende de 87 a 181-182 Hz para losvarones y de 165 a 262-265 Hz para las mu-jeres.

MEDICIONES DE LA PERTURBACIÓN EN FRECUENCIAA diferencia de las medidas anteriores

que se muestran como un índice de la esta-bilidad, la perturbación de la frecuencia (jitter) es la variabilidad de la frecuenciafundamental en ciclos consecutivos. Las me-didas de jitter se relacionan con la variaciónen el corto plazo: el jitter mide cuánto difiereun período dado del período que lo sucedeinmediatamente (Lieberman, 1961). Es im-portante considerar que se han reportadoimportantes diferencias de aproximada-mente el 22.5% en la estimación del jitter apartir de la señal acústica y la electrogloto-gráfica (Vieira, McInnes & Jack, 1996,2002).

Este parámetro es uno de los más emple-ados y con mayor tradición tanto en la clí-nica como en la investigación. El valor me-dio del Jitta en la muestra estudiada fue de13.86 microsegundos (µs) para las mujeresy de 31.31 µs para los hombres, mostrandoalta variabilidad observable en los desvíosestándar, principalmente en las voces mas-culinas. Estos valores son inferiores a los re-ferenciados por PRAAT como normativos(83.2 µs).

Otro tipo de medición clínica interesantees el Jitt que considera en términos relativoso porcentuales la variación respecto al perí-odo. En la muestra estudiada las mujerespresentaron un .29% de variabilidad con res-pecto a la fundamental y los hombres, un.35%. Los resultados se asemejan a los re-portados por otros autores que obtienen.42% en varones de 26 - 33 años (Orlikoff,1990).

Para minimizar los posibles errores dees timación o extracción del F0 también seutilizan algoritmos que suavizan o estilizanlos contornos promediando 3 períodos con-secutivos (RAP), ó 5 períodos (PPQ). Losnuevos valores resultan de la diferencia ab-soluta promedio entre un período y el pro-medio entre éste y sus cuatro vecinos máscercanos, dividido por el período promedio.Los valores medidos en esta muestra resul-taron muy inferiores a los datos normativosdel manual del PRAAT (.16% para RAP y



.17% para PPQ en mujeres y .18% para RAPy .21% para PPQ en hombres) y a otros detrabajos norteamericanos y japoneses (Dwire& McCauley, 1995; Preciado & Fernández,1998; Preciado, García & Infante, 1998; Takahashi & Koike, 1975). Sin embargo, sonsimilares a los obtenidos en España (Fer-nández et al., 1999) en una muestra de 154adultos no fumadores (PPQ = .23%) e in-cluso al del grupo de fumadores del estudio(Damborenea et al., 1999; Fernández et al.,1999) (PPQ = .27%) y en los de Walton y Or-likoff (1994) (RAP = .28%).

En ANAGRAF, la media de Jitter_pr parael grupo H fue igual a 1.35% para mujeres ya 1.02% para los hombres, superando losvalores dados por el programa (< 1%) comonormalidad. Para calcular el Jitter cc se re-quiere calcular el F0cc y como este cálculono es confiable, en ANAGRAF se debecumplir la condición que el F0cc dé igual alF0prom (calculado por el método RAPT)para aceptar como confiable el valor de jitter cc (Gurlekian, 2001).

MEDICIONES DE LA PERTURBACIÓN EN AMPLITUDLas medidas de perturbación de la ampli-

tud, o shimmer, son análogas a los índices dejitter. Sin embargo, si bien cuenta con tradi-ción en la clínica no ha sido tan estudiadocomo el jitter. Tampoco es clara la relacióndel shimmer con anormalidades específicasde la función glótica, pero los valores tiendena normalizarse cuando se reduce la patologíalaríngea. Todos los valores medios para hom-bres y mujeres medidos en la muestra anali-zada son muy inferiores a los valores nor-mativos del programa (ShimdB = .16 dB y.26 dB para mujeres y hombres, respectiva-mente) y a los reportados por otros autores(Fernández et al., 1999; Horii, 1979; Precia -do & Fernández, 1998) (ver Tabla 1).

En ANAGRAF, la media de shimmerpara el grupo H fue igual a .27 dB para mu-jeres y .32 dB para los hombres, ubicándosedentro de los valores de normalidad dadospor el programa (.30 dB) (ver Tabla 2).

MEDICIONES DE RUIDOLa relación armónico-ruido (HNR) es una

medida que cuantifica la cantidad de ruidoaditivo en la señal de la voz. Consiste en elcociente entre la energía espectral debida alas componentes armónicas de la señal y lacorrespondiente al ruido. En ANAGRAF, lamedia de la relación armónico-ruido (HNR)en el grupo H fue igual a 6,53 dB y 6,63 dBpara mujeres y hombres, respectivamente.En este caso la muestra analizada supera losvalores dados como normales. Se suponeque esto es consecuencia de la alta exigen-cia en los criterios de inclusión impuestos ala selección de la muestra del grupo de vo-ces normales (H).

PRAAT propone que una medida originalde HNR debe ser de 20 para /a/ ó /i/ y de 40para la vocal /u/. En consecuencia, unaHNR por debajo de 20 es considerada comouna medida de notable ronquera. En lamuestra estudiada se encontró HNR de24,35 y 22,07 para mujeres y hombres, res-pectivamente.

SECCIÓN II. VALORES PATOLÓGICOS

Se han resumido, en los casos en que hasido posible, los datos en tablas que intentanaproximar a normas, entiéndase medias, des-viaciones típicas y rango de valores de losparámetros de ANAGRAF y PRAAT. Sólointentan servir como guías para interpretarlos resultados.

Para cada grupo y sexo se compararon losvalores medios de frecuencia fundamental,perturbación de la frecuencia y perturbaciónde la amplitud y ruido de la vocal /a/ del Es-pañol de Buenos Aires, que es la vocal in-formada en la clínica. Se analizaron estosvalores con relación a los puntos de corteque establece cada medición en cada sis-tema en comparación.

Muchas de las mediciones son útiles paraun amplio espectro de desórdenes vocales,por lo que la clasificación por tipo de pato-logía no resultó la adecuada, pero sí se con-

Elisei


sideró desagregarlas y analizarlas según sugrado de severidad y confiabilidad.

MEDICIONES DE FRECUENCIA FUNDAMENTALSe observó que en el Grupo P aumentó la

variabilidad en todos los parámetros medi-dos y esto se reflejó especialmente en lamedida de desvío estándar. En las mujeres,el F0 disminuye y en hombres aumenta,mientras que la medida de máximo tono au-menta en ambos (ver Tablas 3 y 4).

MEDICIONES DE LA PERTURBACIÓN EN FRECUENCIAAl analizar las medidas de perturbación

en PRAAT: Jitt, Jita, RAP y PPQ en las mu-jeres de la muestra, los valores medios nor-males resultaron muy inferiores (Jitt = .29%;Jitta = 13.86 µs) como así también los valo-res patológicos.

Si no son desagregados los grupos porsexo y se considera, además del valor medio,el desvío estándar, el valor que se obtienecomo rango superior no llega a superar elumbral que el programa informa como puntode corte entre la normalidad y la patología.Cabe aclarar que en este caso, el grupo denormalidad es de una normalidad rigurosaen tanto se trata de hablantes locutores en-trenados, con lo cual se flexibilizaría elrango superior, pero habría que estudiar quéocurre en una muestra de no entrenados y, sien verdad se llega a equiparar el umbralconfigurado por el programa. Cuando sedesagrega por sexo, se verifica que en loshombres esto no ocurre y los umbrales po-drían considerarse concordantes exceptopara PPQ donde se encuentra la misma di-ferencia que en las mujeres (ver Tabla 5).

En ANAGRAF, los valores normales me-dios medidos del parámetro jitter_cc, son su-periores al umbral. Si se tiene en cuenta eldesvío estándar, los valores obtenidos (jitter_cc = 3.37%) se pueden interpretarcómo voces normales pero serían categori-zadas como patológicas cuando no lo son.En los hombres ocurre lo mismo, a diferen-

cia de que los valores de jitter son menores(ver Tabla 3).

MEDICIONES DE LA PERTURBACIÓN EN AMPLITUDEn las medidas de shimmer pareciera en-

contrarse una mayor consistencia. Tanto enPRAAT como ANAGRAF los valores me-dios medidos para voces normales y patoló-gicas concuerdan más con las medias y um-brales dados por los sistemas. Un ejemplo enPRAAT es el Shim% medido en las mujeresque se aproxima con valores medios de1.81% ± .51 y 3.49% ± 2.49 para normalesy patológicos, respectivamente, al umbralque es 2.52%. Sin embargo, en los hombreslos valores medios medidos son superiores(Shim% = 2.93 ± 1.53 y 5.86 ± 4.93 para Hy P, respectivamente) tanto a la media comoal umbral (media = 2.52% y um -bral = 3.81%) propuesto por PRAAT, por loque voces normales de la muestra pasaríanpor patológicas (ver Tabla 6).

En ANAGRAF esta medida tiene lamisma limitación si se incluye en el análisis,el desvío estándar tanto en mujeres como enhombres. En la muestra estudiada los valo-res medios de normalidad van de .27 ± .67dB (mujeres) y .32 ± .12 dB (hombres). Si seconsidera un umbral en .30 dB, se estaríancategorizando casos normales como pato-lógicos (ver Tabla 3).

MEDICIONES DE RUIDOLos valores medidos de HNR en ANA-

GRAF tanto en hombres como en mujeresmostraron ser relativamente ajustados aunconsiderando los desvíos estándares en elanálisis (ver Tabla 3).

MEDIDAS SEGÚN EL GRADO DE SEVERIDAD DE LASPATOLOGÍAS

Se analizaron las mismas medidas ante-riormente descriptas por el grado de severi-dad de la patología (Elisei, 2011) para eva-



luar si la influencia de la variedad diagnós-tica del hablante normal (N), con patologíasleves a moderadas (LM) y mode radas a se-veras (MS) hacía variar estos resultados.Por no cumplirse el supuesto de homoce-dasticidad o supuesto de homogeneidad devariancias, para el análisis de la variancia(test de Levene) se utilizó el test robusto deBrown Forsythe. En la vocal /a/ se encon-traron diferencias significativas para las va-riables, exceptuando la media y mediana detono para las mujeres y el mínimo tono paralos hombres. Aplicando el test a posterioride Dunnet con un nivel de significaciónglobal del 5% se encontraron diferenciassignificativas en todos los parámetros me-didos exceptuando los sigiuentes casos:

En mujeres, en la mediana del tono (me-dian pitch) y la media del tono (mean pitch)entre las 3 categorías: N, LM y MS, de loque se interpreta que estos parámetros noson los más sensibles a la hora de caracteri-zar subgrupos, sino más bien casi constantesdel sexo. Tampoco se encontraron diferen-cias entre tono mínimo y máximo (minimumy maximum pitch) entre LM y MS, pero síentre N y LM y N y MS, por lo que se in-terpreta que esta medida sí puede ser rele-vante al momento de distinguir entre dife-rentes niveles de severidad. Las cincomedidas de jitter no muestran diferenciassignificativas entre LM y MS, pero sí con N,indicando que si bien (aún con sus limita-ciones) son medidas sensibles para distin-guir voces normales de patológicas, no pue-den caracterizar grados de severidad enpatologías.

En hombres se encontró que la medianay la media del tono no se diferencian paraLM y MS pero sí logran diferencias signifi-cativas ambos con N. La medida del tonomínimo se comporta de forma semejante alas mujeres: no muestran diferencias signi-ficativas entre niveles de severidad, aunquesí se observan diferencias en el parámetro detono máximo en los tres niveles. En tres delos jitter no se observan diferencias Jita,RAP y DDP, al igual que APQ11.

En ANAGRAF se realizó el mismo aná-lisis encontrándose diferencias significativas

para todos los parámetros a excepción def0_pr y f0_cc. Los resultados del test a pos-teriori de Dunnet evidenciaron diferenciassignificativas en el parámetro HNR para lastres categorías tanto N, LM y MS. Para elparámetro jitter se encontraron diferenciasentre N y MS y para shimmer entre N y MSy LM y MS, no así entre N y LM. Estomuestra que la detección en el continuo queva desde la normalidad a la patología no estarea sencilla siendo específicamente entrenormales (N) y patológicos leves (LM), lasdiferencias no significativas.

En resumen, lo que se puede observar enlas Tablas 3, 4, 5 y 7 es cómo los valores me-dios, los desvíos y los rangos aumentan en-tre los grupos según el grado de severidad ycómo estos desvíos y rangos dan cuenta dela variancia de cada medición según elgrupo. Es interesante pensar que a medidaque aumenta la variancia, también aumentanlas dudas sobre la sensibilidad de estas me-diciones para esos tipos determinados de se-ñales. Las excepciones son AC y HNR quedisminuyen lógicamente por la degradaciónen las señales más patológicas y NHR queparece no encontrar diferencias entre N yLM, dando cuenta nuevamente de que no se-ría tan evidente hallar diferencias entre vo-ces normales y patológicas leves con estamedida.

CONFIABILIDAD DE LAS MEDIDASPara evaluar el grado de confiabilidad de

las medidas obtenidas se comparó la estabi-lidad de los parámetros en una prueba test-retest mediante el análisis de dos muestrasconsecutivas de voz tomadas en cada sujeto.Se utilizó el test de correlación de Pear soncomo medida de confiabilidad. El métododel test-retest prevé la aplicación de dos ve-ces el mismo test (el lapso entre las aplica-ciones se determina previamente), a una mis -ma muestra de individuos. Las dos series depuntajes resultantes se correlacionan con elcoeficiente de correlación r de Pearson pa ramedir el grado de asociación entre dos va-riables asumiendo valores entre -1 y 1. Los

Elisei


valores próximos a 1 indicarán fuerte aso-ciación lineal positiva, los valores próximosa -1 indicarán fuerte asociación lineal nega-tiva y los valores próximos a 0 indicarán noasociación lineal, lo que no significa que nopueda existir otro tipo de aso ciación.

En las Tablas 3, 4, 5, 6 y 7 se presentanlos valores de las correlaciones y se observaque es poco probable que esta correlación sedé por el azar para la mayoría de los pará-metros. Los coeficientes menores a .7 su-gieren, a diferencia de los demás, que existeuna media y baja correlación entre las mues-tras. La medición de la frecuencia funda-mental parece ser estable y confiable; sinembargo, esta alta correlación disminuye enla medida de desviación estándar dandocuenta allí de las discrepancias o variacionesque pueden existir en la producción de untono sostenido. En las mediciones de jitter,se observa una estabilidad alta con coefi-cientes de .807 a .879 para los normales y demoderada a baja con valores entre .881 a.547 para los patológicos. Esto se asocia conlas limitaciones que encuentran estas medi-ciones para el cálculo cuando la señal con-tiene mayores irregularidades y deja de sercuasi periódica. Las mediciones de pertur-bación de la amplitud varía entre .831 a .798en voces normales y de .872 a .691 para lasvoces patológicas, mostrando un comporta-miento semejante a la perturbación de fre-cuencia. Dentro de los parámetros de ruido,ambos logran altas consistencias en sus me-diciones. También se puede observar queLM tiene menor correlación en general queN y MS.

CONCLUSIONES

En este trabajo se han presentado las me-diciones tradicionales relacionadas con lafrecuencia fundamental, la perturbación dela frecuencia y la amplitud y la relación ar-mónico - ruido, dado que a pesar de no seruna medida de aperiodicidad es tradiciónmedirla en la clínica diaria. Es difícil deter-minar con precisión las normas para medi-das acústicas tales como jitter, shimmer,

harmonic-to-noise ratio y la frecuencia fun-damental. Hay muchos factores que atentancontra la declaración de que todo puedeabarcarse en normas. Algunos de ellos sonespecíficos de las personas (sexo y edad),culturales (lo que para una lengua puedeconsiderarse dentro de límites normales,puede ser diferente para otra) y en relacióncon el entorno de prueba (la variación en elequipo utilizado y, más importante aún, eluso de diferentes algoritmos de los progra-mas de software que se utilizan para hacerlas mediciones). Mientras que la evaluaciónacústica de la voz se compromete a propor-cionar una medida objetiva de los paráme-tros relevantes, existen muchos elementosque influyen en la comparación de los re-sultados obtenidos en diferentes ocasiones.En particular, en el estudio que se informase ha centrado la atención en las diferenciasentre sistemas frente a un mismo continuoque se extiende de la normalidad a la pato-logía en sus diferentes grados.

Los resultados aquí obtenidos sugierenque es preferible automatizar el análisis paracolaborar en la detección de valores dife-rentes y/o erróneos. Pareciera importante te-ner en cuenta las diferencias de sexo en lamayoría de los parámetros explorados, porlo que se sugiere considerar los valores nor-mativos desagregados por sexo.

Los valores de tendencia central y dis-persión medidos en la muestra estudiada dehablantes normales verifican diferencias sig-nificativas en relación a los estándares pro-puestos por defecto por ambos sistemas.

Estos valores cobran mayor significanciacuando se intenta no sólo detectar, sino tam-bién caracterizar la patología en sus gradosde severidad: normal (N), leve-moderado(LM) y moderado a severo (MS). Interpre-tando los datos medidos y tomando el puntode corte o umbral entre la normalidad y lapatología dados por los sistemas, se puedeobservar que utilizando PRAAT muchos ca-sos son subestimados (falsos negativos) ycon ANAGRAF muchos casos son sobrees-timados (falsos positivos).

Con el propósito de indagar la confiabi-lidad de las medidas utilizadas se realizó



una prueba de test-retest y se midió la co-rrelación entre los resultados obtenidos. Sevio que a medida que aumenta el grado deseveridad de las patologías, disminuye lacorrelación. Esto se asocia con las limita-ciones que encuentran estas mediciones parael cálculo cuando la señal contiene mayoresirregularidades y deja de ser cuasi perió-dica. Cuando esto ocurre, el coeficiente decorrelación disminuye al punto de hacerpoco fiable su valor.

Finalmente y atendiendo a las diferen-cias de sistema empleado, sexo, grado de se-

veridad de las patologías y confiabilidad decada medida se presentan los valores me-dios, desvíos estándares y rangos medidosen voces normales y patológicas.

La contribución del estudio que se in-forma reside en evidenciar estas diferenciasy proponer guías que las consideren, sobretodo cuando hay evidencia empírica de queguiada por los valores medios y umbrales decada sistema, la precisión diagnóstica podríaser cuestionada.

Elisei


TABLA1

RESU

LTADO

SMED

IDOSC

ONPR

AAT E

NMU

JERE

SYHO

MBRE

SNOR

MALES

*Sigu

e la d

istrib

ución

norm

al. Te

st de

Lillie

fords

.



PRAA

T – VR

Resu

ltado

s med

idos m

ujeres

Μσ

p

Valor

es es

tánda

r

Umbra

lp

µ

Umbra

l

σ

Resu

ltado

s med

idos h

ombre

sµ

σ

p

Media

n_pit

chMe

an_p

itch

Jitt %

Jitta

(us)

RAP %

PPQ

%Sh

im %

ShdB

(dB)

APQ

%

207

207

.29 13.86 .16 .17 1.81

.16 1.43

24.2

24.1 .15 6.09

.10 .08 .51 .04 .41

.01 .00 .00 .00 .00 .00 .00 .00 .00

< .05

< .05

< .05

> .20

*> .

20*

< .10

*< .

10*

> .20

*> .

20*

200 -

120

200 -

120

.59 41.66 .35 .34 2.52

.22 1.99

1.04

83.20 .68 .84 3.81

.35 3.07

.68 .68 .54 36.48 .33 .29 1.00

.09 .81

119

119 .35 31.31 .18 .21 2.93

.26 1.81

20.42

20.35 .13 14.59 .08 .08 1.53

.13 .93

.00 .00 .00 .00 .00 .00 .00 .00 .00

TABLA2

RESU

LTADO

SMED

IDOSC

ONAN

AGRA

F ENMU

JERE

SYHO

MBRE

SNOR

MALES

Elisei


ANAG

RAF

Resu

ltado

s med

idos m

ujeres

Μσ

p

Valor

es es

tánda

r

Umbra

l

Resu

ltado

s med

idos h

ombre

s

µ

σ

p

f0_pr

f0_cc

jitter-

ccSh

imme

rHN

R

200 /

120

200 /

120

1 .3 4

207

206

1.35

.27 6.53

23.97

25.31 2.02

.67 2.55

.01 0 .09 .66 0

118

118

1.02

.32 6.63

20.45

20.42 1.72

.12 2.4

0 .41 .93 .13 0

TABLA3

RESU

LTADO

SMED

IDOSC

ONAN

AGRA

F ENMU

JERE

SYHO

MBRE

SNOR

MALESS

EGÚN

GRAD

ODE

SEVERID

ADDE

LASP

ATOLOG

ÍAS

Notac

iónN: no

rmal

LM: le

ve-m

odera

daMS

: mod

erada

-seve

ra



ANAG

RAF

Fuen

teMu

jeres

nµ

σ

Rang

or

Homb

resn

µ

σRa

ngo

f0_pr

f0_cc

jitter-

cc

shimme

r

HNR

N LM MS N LM MS N LM MS N LM MS N LM MS

9820

7

23.9

69

165

2

6215

5

199

27.2

57

147

2

807

78

19

366

.845

0

374

9820

625

.308

13

0

268

155

200

27.62

7

148

28

878

203

57.72

92

395

981.3

5 2.0

2

.26

10.6

315

54.3

720

.43

.11

2

5478

9.12

1

2.45

.1

2

55.47

98.27

.67-1.

68

6.49

15

5.38

.20.11

1

.6778

.83

1.1.20

8

.14

986.5

32.5

5

-

.13

10.8

155

3.34

2.63

-2.7

1 8

.5778

1.26

2.64

-3.8

6 6

.41

.991

.975

.855

.986

.89 .86 .728

.351

.374

.274

.729

.808

.55 .762

.863

9811

820

.4587

181

6413

321

.1989

180

6914

7

46

.7990

329

9811

820

.4284

182

6413

122

.965

180

6912

762

.010

312

981.0

21.7

2.21

1064

3.42

3.35

.3210

695.4

83.9

6.51

10

98.32

.12.13

.864

.63

.40

.212.2

169

.92

.69.35

4.23

986.6

32.4

.0110

.5864

2.31

3.0-5.

437.7

869

.062.7

7-5.

45.3

TABLA4

RESU

LTADO

SDEF

RECU

ENCIA

FUND

AMEN

TALM

EDIDO

SCON

PRAAT E

NMU

JERE

SYHO

MBRE

SNOR

MALESS

EGÚN

GRAD

ODE

SEVERID

ADDE

LASP

ATOLOG

ÍAS

Notac

iónN: no

rmal

LM: le

ve-m

odera

daMS

: mod

erada

-seve

ra

Elisei


PRAA

TFu

ente

Mujer

esn

µ

σRa

ngo

rHo

mbres

nµ

σ

Rang

o

Media

n pitch

Mean pitch

SD Minim

um pitch

Maxim

um pitch


98

206.8

224

.216

526

515

519

7.628

.9410

328

878

199.2

452

.7190

419

9820

6.89

24.17

165

264

155

197.4

828

.61111

288

7820

0.59

49.99

9142

2

981.8

.68

.72

3.4

715

53.5

6

8.4

8.67

7

4.35

7813

.1426

.69.67

14

5.47

9820

2.59

23.93

160

258

155

189.3

4

35.3

374

277

7817

6.37

56.62

7438

6

9821

1.62

24.32

170

268

155

204.8

229

.4212

730

878

229.9

582

.2110

249

6

.999

.917

.811

.999

.927

.874

.045

.332

.708

.998

.086

.779

.997

.919

.874

9811

920

.42

8718

264

132

21.14

8817

966

144

43.98

8932

1

9811

920

.3587

182

6413

120

.7188

179

6614

441

.889

295

981

.631

564

36.1

41

4366

1020

.191

107

9811

620

.0985

179

6412

322

.577

176

6612

238

.1673

227

9812

222

.1191

184

6414

123

.995

196

6616

360

.6693

365

TABLA5

RESU

LTADO

SDEP

ERTURB

ACIÓN

DELAFR

ECUE

NCIAFU

NDAM

ENTALM

EDIDO

SCON

PRAAT E

NMU

JERE

SYHO

MBRE

SNOR

MALESS

EGÚN

GRAD

ODE

SEVERID

ADDE

LASP

ATOLOG

ÍAS

Notac

iónN: no

rmal

LM: le

ve-m

odera

daMS

: mod

erada

-seve

ra



Fuen

teMu

jeres

nµ

Σ

Ra

ngo

rHo

mbres

nµ

σ

Rang

o

Jitt

Jita

RAP

PPQ5

DDP


98.29

.15

.16

115

5.42

.31

.09

2.86

78.67

.90

.18

5.99

9813

.866.0

96.1

2

41.54

155

21.97

16.77

3.76

137

.6278

39.31

68.31

7.64

430

.4

98.16

.10

.08

.6615

5.24

.17.05

1

.5378

.34

.37

.10

2.71

98.17

.08.09

.661

155

.25.21

.06

1.99

78.38

.46

.10

3.31

98.48

.29.23

1

.9715

5.71

.52.14

4.678

1.02

1.1.29

8

.13

.807

.547

.907

.879

.679

.881

.807

.561

.882

.816

.466

.855

.807

.561

.882

98.35

.13

.16.95

64.74

1.15

.21

8.4

566

1.56

2.36

.23

12.3

1

9831

.3114

.599.4

5 9

0.01

6460

.8210

0.32

11.65

712

.4466

117.4

118

4.12

10.97

97

4.08

98.18

.08.07

.5964

.42.73

.115.3

966

.891.3

9.11

6.81

98.21

.08.08

.5064

.40

.51.13

3.59

66

.911.5

5.11

9.04

98.55

.25

.21.7

664

1.26

2.19

.32

16

.1766

2.66

4.16

.31

20

.42

TABLA6

RESU

LTADO

SDEL

APER

TURB

ACIÓN

DELAAM

PLITU

DME

DIDOS

CONPR

AAT E

NMU

JERE

SYHO

MBRE

SNOR

MALESS

EGÚN

GRAD

ODE

SEVERID

ADDE

LASP

ATOLOG

ÍAS

Notac

iónN: no

rmal

LM: le

ve-m

odera

daMS

: mod

erada

-seve

ra

Elisei


PRAA

TFu

ente

Mujer

esn

µ

Σ

Ran

go

rHo

mbres

nµ

Σ

R

ango

Shim

ShdB

APQ3

APQ5

APQ1

1

DDA

N LM MS N LM MS N LM MS N LM MS N LM MS N LM MS

981.8

1

.5

11.0

23.3

2

15

52.7

11.7

1.61

1

4.47

785.0

63.0

21.3

3 1

2.72

98.16

.04.09

.2915

5.24

.15.05

1.31

78.46

.29.12

1

.22

98.97

.29.55

1

.8615

51.4

6.91

.307.7

278

2.75

1.67

.597.8

3

981.1

.32.64

2.115

51.6

81.1

4.37

9

.4478

3.04

1.76

.757.9

7

981.4

3.41

.742.7

715

52.0

61.2

6.56

1

0.678

3.69

2.33

1.05

12.7

1

982.9

1

.8

81.6

45.5

815

54.3

82.7

3.90

2

3.17

788.2

55.0

2

1.78

23.4

8

.826

.824

.876

.831

.836

.872

.825

.827

.832

.826

.771

.833

.798

.691

.806

.827

.827

.832

982.9

31.5

3

.88

8

.76

64

4.53

3.17

1

.41

15.48

667.1

65.9

2

1.82

24

.57

98.26

.1

3

.08

.7964

.4

.28

.1

3

1.39

66.64

.53

.16

2.2

981.5

7.88

.41

4.

6764

2.4

1.66

.

70

8.33

663.8

93.2

1

12.6

3

981.8

1

.9

3

.5

3

5.46

642.8

1

2.

04

.8

1

9.77

654.2

23.6

3

1.14

20

.49

982.4

41.2

2

.81

7

.1464

3.52

2.47

.

96

11.65

634.4

42.9

2

1.4

12

.95

984.7

22.6

3

1.24

1

464

7.24.9

8

2.1

2

4.99

6611

.689.5

9

3.01

37

.89

TABLA7

RESU

LTADO

SDEM

EDIDA

SDER

UIDORE

ALIZA

DASC

ONPR

AATE

NMU

JERE

SYHO

MBRE

SNOR

MALESS

EGÚN

GRAD

ODE

SEVERID

ADDE

LAS

PATO

LOGÍA

S

Notac

iónN: no

rmal

LM: le

ve-m

odera

daMS

: mod

erada

-seve

ra



PRAA

TFu

ente

Mujer

esn

µ

σ Ra

ngo

rHo

mbres

nµ

σ

Ra

ngo

AC NHR

HNR

N LM MS N LM MS N LM MS

98.99

0.96

115

5.99

.01.91

178

.96.06

.671

98.01

00

.0415

5.01

.01

0

.10

78.06

.11

0.65

9824

.352.3

3

1

5.12

29.0

415

522

.033.5

9

1

1.25

31.7

878

16.54

4.52

3.94

23.8

1

.838

.71 .923

.823

.648

.904

.879

.912

.951

98.99

.01

.9

2

1

64.96

.06

.7

3

1

66.89

.13

.5

6

.99

98.01

.01

0

.09

64.05

.08

0

.48

66.16

.24

.0

1

.84

9822

.073.2

8

12.63

2

9.86

6418

.265.1

6

5.38

2

7.14

6613

.126.0

8

1.06

2

2.82

REFERENCIAS BIBLIOGRÁFICAS

Baken, R.J. & Orlikoff, R. (2000). Clinicalmeasurement of speech and voice (2da. ed.).San Diego, USA: Singular Publising Group.doi: 10.3109/14417040008996786.

Bielamowicz, S., Kreiman, J., Gerratt, B.R., Dauer,M.S. & Berke, G.S. (1993). Comparison ofvoice analysis systems for perturbation mea -surements. Journal of Acoustical Society ofAmerica, 9(4), 2337. doi:10.1121/1.4062 76.

Boersma, P. (2009). Should jitter be measured bypeak picking or by waveform matching? FoliaPhoniatrica et Logopaedica, 61, 305-308. doi:10.1159/000245159.

Burris, C. (2011). Acoustic analysis software: Aquantitative and qualitative comparison of foursystems. Tesis de Maestría no publicada. Uni -versity of Wisconsin. Maddison, USA.

Damborenea, D., Fernández, R., Llorente, E.,Naya, M.J., Marín, C., Rueda, P. et al. (1999).Efecto del consumo de tabaco en el análisisacústico de la voz [Smoking effects in voiceacoustic analysis]. Acta OtorrinolaringológicaEspañola - Sociedad Española de Otorrinola -ringología, 50(2), 448-452.

Deliysky, D.D. & Boersma, P. (1993). Accurateshort-term analysis of the fundamental fre -quen cy and the harmonics-to-noise ratio of asampled sound. Proceedings of the Institute ofPhonetic Sciences, 17 (pp. 97-110). PaísesBajos: Univer sidad de Amsterdam.

Dwire, A. & McCauley, R. (1995). Repeated mea -sures of vocal fundamental frequency per tur- bations obtained using de Visi-Pitch. Journalof Voice, 9, 156-162. doi:10.1016/ S08921997(05)80249-8.

Elisei, N.G. (2011). Evaluación acústica y per -ceptual de la voz para la detección y ca rac- terización de los desórdenes vocales [Acousticand perceptual voice assessment for the detec -tion and characterization of vocal disorders].Tesis Doctoral no publicada, Uni versidad deBuenos Aires. Buenos Aires.

Fernández, R., Damborenea, D., Rueda, P., García,E., Leache, J., Campos, M.A. et al. (1999).Aná lisis acústico de la voz normal en adultosno fumadores [Acoustic analysis of normalvoice in nonsmoking adults]. Acta Otorrino -larin gológica Española - Sociedad Españolade Oto rrinolaringología, 50(2), 134-141.

Godino-Llorente, J.I., Osma-Ruiz, V., Saenz-Lechon, N., Cobeta-Marco, I., Gonzalez-Herranz, R. & Ramirez-Calvo, C. (2008).Acoustic analysis of voice using WPCVox: Acomparative study with Multi DimensionalVoice Program. European Archives of Oto-Rhino-Laryngology, 265(4), 465-476. doi:10.1007/s00405-007-0467-x.

Gurlekian, J. (1997). El laboratorio de audición yhabla del LIS [Speech and auditory laboratoryfrom LIS]. En M. Guirao (Ed.), Procesos sen -soriales y cognitivos (pp. 55-81). Buenos Aires:Dunken.

Gurlekian, J.A. (2001). La percepción auditiva[Auditory percepion]. En I. Bustos Sanchez(Ed.), La percepción auditiva: Un enfoquetransversal (pp. 51-90). Madrid: CEPE.

Horii, Y. (1979). Fundamental frequency pertur -bation observed in sustained phonation. Jour- nal of Speech and Hearing Research, 22, 5-19.

Lieberman, P. (1961). Perturbations in vocal pitch.Journal of Acoustical Society of America, 33(5), 597-603. doi: 10.1121/1.1908736.

Oguz, H., Kilic, M.A. & Safak, M.A. (2011).Comparison of results in two acoustic analysisprograms: PRAAT and MDVP. Turkish Jour -nal of Medical Sciences, 41(5), 835-841.

Orlikoff, R. (1990). Heartbeat-related fundamentalfrequency and amplotude variations in healthyyoung and elderly male voices. Journal ofVoice, 4, 322-328. doi: 10.1016/S08921997(05)80049-9.

Preciado, J.A. & Fernández, S. (1998). El análisisdigital de la señal acústica en el diagnóstico dela patología vocal. Sensibilidad y especificidadde las medidas del shimmer y del jitter [Thedigital analysis of the acoustic signal in the

Elisei


diagnosis of vocal pathology. Sensitivity andspecificity of the measures of shimmer andjitter]. Acta Otorrinolaringológica Española -So ciedad Española de Otorrinolaringología,49(6), 475-481.

Preciado, J.A., García, R. & Infante, J.C. (1998).Análisis multidimensional de la función vocal.Estudio de casos y controles [Multidimensionalanalysis of vocal function. Case-control study].Acta Otorrinolaringológica Española - Socie -dad Española de Otorrinolaringología, 49(6),467-474.

Takahashi, H. & Koike, Y. (1975). Some percep -tual dimensions and acoustical correlates ofpathologic voices. Acta Oto-laryngologica.Supplementum, 338, 1-24.

Vieira, M.N., McInnes, F.R. & Jack, M.A. (1996).Robust F0 and jitter estimation in pathologicalvoices. Fourth International Conference onSpoken Language ICSLP 96, 745-748. doi:10.1121/1.1430686.

Vieira, M.N., McInnes, F.R. & Jack, M.A. (2002).On the influence of laryngeal pathologies onacoustic and electroglottoraphic jitter mea -sures. Journal of Acoustical Society of Amer- ica, 111(2), 1045-1055.

Walton, J. & Orlikoff, R. (1994). Speaker raceidentification from acoustic cues in the vocalsignal. Journal of Speech Hearing Research,38, 738-745.



Laboratorio de Investigaciones Sensoriales (LIS)Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET) Ciudad Autónoma de Buenos Aires

República Argentina

Fecha de recepción: 21 de mayo de 2012 Fecha de aceptación: 6 de agosto de 2012

ANÁLISIS ACÚSTICO DE LA VOZ NORMAL Y PATOLÓGICA UTILIZANDO DOS SISTEMAS DIFERENTES- ANAGRAF y...

Documents

Transcript of ANÁLISIS ACÚSTICO DE LA VOZ NORMAL Y PATOLÓGICA UTILIZANDO DOS SISTEMAS DIFERENTES- ANAGRAF y...