TRABAJO FIN DE CARRERA. Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro...

Post on 12-Mar-2015

1 views 0 download

Transcript of TRABAJO FIN DE CARRERA. Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro...

Generación de Máscaras Soft para Compensación de Características en Reconocimiento Robusto del HablaI v á n L ó p e z E s p e j o

TRABAJO FIN DE CARRERA

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

SUMARIO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

1. INTRODUCCIÓN Y MOTIVACIÓN

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Acto de hablar: Usualmente en entornos acústicos ruidosos Alta capacidad de reconocimiento en el ser

humano Necesidad de adaptación de los sistemas ASR

1. INTRODUCCIÓN Y MOTIVACIÓN

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Acto de hablar: Usualmente en entornos acústicos ruidosos Alta capacidad de reconocimiento en el ser

humano Necesidad de adaptación de los sistemas ASR

Algunas técnicas para mejorar el matching: Adaptación de los modelos Descomposición de HMMs Realce de las características de voz

1. INTRODUCCIÓN Y MOTIVACIÓN

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

1. INTRODUCCIÓN Y MOTIVACIÓN

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Motivaciones Mejora del rendimiento de un sistema ASR Ventajas de la metodología de realce Aplicaciones:

Búsqueda de información Ejecución de transacciones Control de sistemas (entornos industriales) …

1. INTRODUCCIÓN Y MOTIVACIÓN

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

2. FUNDAMENTOS DEL SEGUIMIENTO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Seguimiento: Estimación de la secuencia de estados de un sistema a partir de sus observaciones

Modelo compuesto de dos procesos Proceso de estados Proceso observado

Solución MMSE

2. FUNDAMENTOS DEL SEGUIMIENTO

SeguimientoBayesiano

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Justificación del filtro de partículas Evaluación compleja: Solución: modelado markoviano

Aproximación numérica: (muestreo y remuestreo de importancia + integración de Monte Carlo)

2. FUNDAMENTOS DEL SEGUIMIENTO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

3. DISEÑO DEL FILTRO BAYESIANO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Seguimiento de ruido en el domino log MelRuido (estado del sistema)Voz limpia (ruido que contamina la observación)Voz ruidosa (observación)

Definición del espacio de estados dinámico Proceso de ruido, Proceso observado,

3. DISEÑO DEL FILTRO BAYESIANO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

3.1 Modelado del proceso de ruido

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Codificación de la previsibilidad del ruido: proceso AR en el dominio log Mel

3.1 Modelado del proceso de ruido

Minimizar

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Definición implícita de una distribución gaussiana para el ruido:

Selección de orden unidad para el modelo AR

Distribución a priori modelada como una gaussiana:

3.1 Modelado del proceso de ruido

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

3.2 Relación entre estados y observaciones

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Se parte de la aproximación:

¿Cuál es la relación entre las observaciones y el ruido?

3.2 Relación entre estados y observaciones

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

¿Cuál es la relación entre las observaciones y el ruido?

3.2 Relación entre estados y observaciones

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

¿Cuál es la relación entre las observaciones y el ruido?

Distribución para la voz limpia:

3.2 Relación entre estados y observaciones

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Imponemos Se aplica la ley fundamental de

transformación de probabilidades

De esta forma,

3.2 Relación entre estados y observaciones

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

3.3 Filtro SIR aplicado

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

1. Generación de N partículas

2. Cálculo de pesos normalizados

3. Remuestreo sobre las partículas

3.3 Filtro SIR aplicado

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Existencia de problemas en la práctica

Si no se cumple para ningún j DROPOUT SOLUCIÓN:

Evolución independiente de la observación Pérdida de la trayectoria de seguimiento

SOLUCIÓN: Procedimiento de reinicialización del filtro

3.3 Filtro SIR aplicado

¡NUEVO PROBLEMA!

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Existencia de problemas en la práctica Modos de reinicialización

Generación de nuevas hipótesis sobre la distribución a priori de ruido

Inferir partículas de ruido a partir de muestrear un GMM

3.3 Filtro SIR aplicado

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Existencia de problemas en la práctica Pobre modelado de ruido

Subestimación de hipótesis SOLUCIÓN: Se incentiva una futura

reinicialización si

3.3 Filtro SIR aplicado

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Existencia de problemas en la práctica Mitigación de dropouts TEST DE

ACEPTACIÓN RÁPIDA

3.3 Filtro SIR aplicado

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Modos de inicialización Uso de las l primeras tramas Empleo de la distribución a priori de

ruido

3.3 Filtro SIR aplicado

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

4. GENERACIÓN DE MÁSCARAS SOFT

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

4. GENERACIÓN DE MÁSCARAS SOFT

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

1

2 3

4

1

2 3 4

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

5. TÉCNICA DE REALCE MULTIPLICATIVO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

5. TÉCNICA DE REALCE MULTIPLICATIVO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

Tiempo

Can

ales

Mel

10 20 30 40 50 60 70 80 90 100

2

4

6

8

10

12

14

16

18

20

22

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

6. TEST Y RESULTADOS

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Uso de la base de datos Aurora-2 Empleo del conjunto de test A:

1001 grabaciones con secuencias de dígitos Ruidos: metro, multitud conversando, coche y sala de

exposiciones SNRs: -5dB, 0dB, 5dB, 10dB, 15dB, 20dB y caso limpio

6. TEST Y RESULTADOS

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Test de reconocimiento del habla Aparente independencia del número de partículas

6. TEST Y RESULTADOS

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

-5 0 5 10 15 20 Limpio0.00

20.00

40.00

60.00

80.00

100.00

120.00

Acc. vs. SNR

Base-LineFP (100)Promediado

SNR (dB)

Acc.

(%)

Test de reconocimiento del habla Aparente independencia del número de partículas

6. TEST Y RESULTADOS

Base-Line FP (100) Promediado0

10

20

30

40

50

60

70

80

90

Acc. vs. Técnica empleada

Técnica

Acc.

(%)

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Test de reconocimiento del habla Aparente independencia del número de partículas

WAcc = 1 - WER

6. TEST Y RESULTADOS

16.43% 26.53% 11.71%

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

7. CONCLUSIONES

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Verificación experimental de la utilidad de una técnica de realce

Preferible, por el momento, uso de ruido estimado mediante promediado espectral: Mayor rendimiento del sistema ASR Menor coste computacional

Necesidad de mejorar la calidad de las estimaciones resultantes del filtro de partículas

7. CONCLUSIONES

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Introducción y Motivación Fundamentos del Seguimiento Diseño del Filtro Bayesiano

Modelado del proceso de ruido Relación entre estados y observaciones Filtro SIR aplicado

Generación de Máscaras Soft Técnica de Realce Multiplicativo Test y Resultados Conclusiones Trabajo Futuro

8. TRABAJO FUTURO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Solventar usuales pérdidas del seguimiento en el filtro de partículas Nuevo modelo de ruido a priori Inclusión del término de fase relativa (FAT

innecesario) Optimización de la implementación Experimentación con otros conjuntos de

test Actualización del modelo AR de ruido y de

la distribución a priori Uso de un detector de actividad de voz

Experimentar con un filtro RPF

8. TRABAJO FUTURO

TFC | Generación de Máscaras Soft para Compensación de Características en RSR | Iván López Espejo

Generación de Máscaras Soft para Compensación de Características en Reconocimiento Robusto del Habla

GRACIAS