Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel...
-
Upload
maricela-orrantia -
Category
Documents
-
view
19 -
download
8
Transcript of Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel...
“Control de dispositivos por comandos de voz”
Por: Buenrostro Mariz Jesús AntonioHéctor Manuel Viera García
Asesores: M. en C. Fuentes Covarrubias RicardoM. en C. Fuentes Covarrubias Andrés Gerardo
ÍndiceIntroducción.
Antecedentes.
Estado del arte.
Procesamiento del lenguaje natural.o Aparato fonador
Entorno de desarrollo Arduino.
Robot Mitsubishi rv-m1
Circuito del control Veear.
Conclusiones.
Bibliografía.
Introducción En la actualidad se busca la automatización de todos los procesos de la vida diaria,
mejorando de esta manera la calidad de vida de las personas. La finalidad de este
proyecto es controlar dispositivos por comandos de voz, de tal manera que
cualquiera pueda comunicarse con estos.
El proyecto consistió en el diseño y la implementación del controlador encargado
de manejar el posicionamiento del brazo del robot Mitsubishi rv-m1 aplicando
técnicas del lenguaje natural por medio del speech recognition kit SR-06/sr-07, así
como la utilización del entorno Arduino para programar la interfaz entre la tarjeta
de voz y el brazo de robot.
Nuestros objetivos planteados al inicio de la investigación fueron:
Diseñar la interfaz entre el speech recognition kit y el brazo de robot Mitsubishi rv-
m1 con la ayuda del entorno Arduino.
Desarrollar la tabla de posiciones del brazo del robot.
Adaptar el hardware del brazo robótico con la tarjeta de voz.
Antecedentes En el año 1870 Alexander Graham Bell quería construir un
sistema/dispositivo que hiciera el habla visible a las personas con problemas
auditivos donde el resultado fue el teléfono.
En el año 1880 Tihamir Nemes solicita permiso para desarrollar un sistema
de transcripción automática que identificara secuencias de sonidos y los
imprimiera (texto), pero fue rechazado como "Proyecto no Realista". Treinta
años después AT&T Bell Laboratories construye la primera máquina capaz de
reconocer voz. Requería extenso reajuste a la voz de una persona, pero una
vez logrado tenía un 99% de certeza. Por lo tanto surge la esperanza de que
el reconocimiento de voz sea simple y directo.
A mediados de los 60's la mayoría de los investigadores reconoce que era un
proceso mucho más intrincado y sutil de lo que habían anticipado. Por lo
tanto empiezan a reducir los alcances y se enfocan a sistemas más
específicos como:
Dependientes del Locutor.
Flujo discreto de habla (con espacios / pausa entre palabras).
Vocabulario pequeño (menor o igual a 50 palabras).
Después, IBM y CMV trabajan en reconocimiento de voz continuo pero no se ven resultados
hasta los 70's. A principios de ellos se produce el 1er Producto de reconocimiento de voz, el
VIP100 de Threshold Technology Inc. (utilizaba un vocabulario pequeño, dependiente del
locutor, y reconocía palabras discretas). Gana el U.S. National Award en 1972. Más tarde nace
el interés de ARPA del U.S. Department of Defense, y gracias al lanzamiento de grandes
proyectos de investigación y financiamiento por parte del gobierno, se precipita la época de
la inteligencia artificial.
El proyecto financiado por ARPA busca el reconocimiento de habla continua de un vocabulario
extenso, impulsando a los investigadores a que se enfoquen en el entendimiento del habla.
Los sistemas empiezan a incorporar módulos de:
Análisis léxico (conocimiento léxico).
Análisis sintáctico (Estructura de Palabras).
Análisis semántico (Significado).
Análisis pragmático (Intención).
Estos proyectos terminan en 1976 con el resultado de que CMU, SRI y MIT crearon sistemas
para el proyecto ARPA SUR (Speech Understanding Research).
De los 80's a los 90's surgen los sistemas de vocabulario amplio, que ahora son la norma
(más de 1000 palabras). Adicionalmente bajan los precios de estos sistemas.
Estado del arteEl uso del lenguaje natural utilizado como
medio de comunicación entre humano-máquina ha tenido un impacto muy importante en los últimos años, ya que la tecnología busca facilitar su uso y aplicación, de tal manera que una persona no necesite ser un experto en el área para interactuar con algún dispositivo inteligente, que es el objetivo de la quinta generación de computadoras.
Procesamiento del lenguaje natural Gracias a la inteligencia artificial se han simulado
diferentes funciones del cuerpo humano como la voz,
brazos, piernas, vista, oídos, etc. Es por medio de esta
misma ciencia que estudiamos el sistema de la
comunicación por señales de voz, el cual es la emisión y
recepción de señales fonéticas de forma oral, para de
esta manera comprenderlo y traducirlo al lenguaje
máquina, con el propósito de que un conjunto de
circuitos pueda comprender el lenguaje natural y realizar
una reacción conforme al mensaje emitido.
Aparato fonador La complejidad del cuerpo humano nos permite producir una gran variedad de
sonidos que modulamos para formar las palabras con las que nos comunicamos,
dentro de los componentes que intervienen en el proceso de la producción del habla
se encuentran: la glotis que constituye el verdadero órgano de fonación humano y
está ubicada dentro de la laringe, pulmones, dos pares de cuerdas vocales, las
cavidades de la cabeza relacionadas con el sistema respiratorio y nasofaríngeo, entre
otros. El mecanismo brevemente resumido de dicho proceso es el siguiente:
El diafragma empuja los pulmones, haciendo que se expulse el aire.
El aire circula por la tráquea y laringe, pasando por las cuerdas vocales y haciendo
que vibren con un tono fundamental.
El tono fundamental producido por las cuerdas vocales pasa, a través de la laringe, a
la caja de resonancia que forman las cavidades nasales y orales.
Algunas frecuencias entran en resonancia en las cavidades nasales y orales, saliendo
hacia el exterior como la información más importante del habla.
Aparato fonador
Entorno de desarrollo Arduino Para poder comunicar la tarjeta de reconocimiento de
voz con la computadora que controla el robot Mitsubishi
es necesario tener un dispositivo que nos facilite el
trabajo por eso decidimos trabajar con Arduino.
“Arduino es una plataforma de electrónica abierta
(open source) para la creación de prototipos basada en
software y hardware flexibles y fáciles de usar. Se creó
para artistas, diseñadores, aficionados y cualquiera
interesado en crear entornos u objetos interactivos”
Tarjeta Arduino
Arduino permite capturar información por medio de sensores gracias a sus
pines y puede manifestarse por medio de motores, luces o actuadores, en
nuestro caso por medio del robot Mitsubishi.
El entorno cuenta con su propio lenguaje de programación llamado “lenguaje
de programación Arduino”, basado en wiring y un entorno de desarrollo,
basado en processing, con la gran ventaja de ser código abierto esto quiere
decir que pudimos desarrollar sin comprar licencia y modificar los archivos sin
problemas.
Lo primero que hicimos después de tener la placa Arduino fue la instalación
de los drivers de este a nuestra computadora para eso conectamos la placa al
puerto USB y Windows instalo automáticamente, después cargamos el
software, es muy importante saber la versión del Arduino, nosotros ocupamos
el IDE 0022 de acuerdo con nuestro microcontrolador atmega328.
Para comprobar que funcionó correctamente abrimos un ejemplo de los que
ya vienen incluidos, conectamos el Arduino, seleccionamos el modelo de la
placa, el puerto serie COM1 o COM2 dependiendo de nuestra configuración
preferente y finalmente cargamos el archivo, mediante motores o luces
(diodos) se observa el comportamiento del programa.
Antecedentes del RobotRobot viene de la República Checa usada por
primera vez por el escrito Karel Capek en su
obra R.U.R. (Rossum’s Universal Robots) en
1917, la utilizó para referirse en sus libros, a
máquinas con forma humanoide. Después en
1940, Isaac Asimov la uso para referirse a lo
mismo. Robot significa “labor forzada” o
bien esclavo.
Robot Mitsubishi rv-m1
Hoy en nuestros días el significado no es tomado por
las tendencias del pasado, surge de nuestras
necesidades, agricultura, la industria, etc. Después de
la revolución industrial el término robot cubría ya la faz
de la tierra.
En nuestro caso llamamos robot a un brazo mecánico
capaz de realizar trabajos precisos y del área de la
industria.
El robot Mitsubishi RV-M1 posee 5 grados de
movimiento se representan en la siguiente imagen de
J1 hasta J5. Los movimientos son permitidos por el
cable de señal que recibe los datos y un cable
potencia.
Anatomía del robot
La unidad motora que se encarga del control del robot y de alimentarlo. Se muestra a continuación con sus componentes.
Vista trasera
Caja de enseñanza
La caja de enseñanza es un control manual para el robot, se conecta a la unidad motora en el puerto teaching box. Sirve para programar las rutinas, realizar los movimientos, guardarlos y borrarlos con sus respectivos comandos.
Circuito del control Veear La línea de productos Veear incluye una serie de productos
hardware y software diseñados para ayudarle en el desarrollo e
implementación de capacidades de reconocimiento de voz para
muchas aplicaciones donde la capacidad de comando de voz es
deseada y conveniente.
El circuito utilizado para el proyecto es el “EasyVR Arduino Shield”
por ser una tarjeta multipropósito diseñada para fácilmente añadir
capacidades de reconocimiento de voz en varios lenguajes de
programación, de una manera eficaz, versátil, robusta y rentable
para cualquier aplicación desarrollada en la plataforma Arduino.
Easy Veear
Sensory quickSynthesis 5
EasyVR GUI v2.1.8
conclusiones A partir de la revolución industrial los robots han tomado un gran papel en muchas
áreas de trabajo y en la industria. Son utilizados desde juguetes hasta máquinas de
trabajo forzado ciertamente sin recibir un sueldo. De aquí partió nuestra visión de
crear soluciones a problemas diarios y facilitar las labores humanas.
La industria, el comercio, la agricultura, etc. Son áreas indispensable e
inmediatamente obligatorias para el desarrollo económico del país. Nuestro trabajo
de investigación viene a facilitar y reforzar lo antes ya establecido, aportando una
solución viable, utilizar el brazo de robot Mitsubishi rv-m1 controlado mediante
comandos voz, para realizar labores pesadas o peligrosas sin la intervención directa
con un ser humano.
Al finalizar nuestra investigación y llevarlo a la práctica hemos obtenido los
resultados esperados de nuestro análisis, logrando así aportar una visión más clara
y concreta de los que la inteligencia artificial con la ayuda de algo elemental como
lo es el lenguaje natural, pueden hacer por nuestra vida diaria.
bibliografía Ingrid Kirschning Tlatoa [2005], “Reconocimiento de Voz”.
Documento electrónico consultado el 02/03/2013 en la página de la Universidad de las Américas Puebla: http://ict.udlap.mx/people/ingrid/Clases/IS412/
Bernal Bermúdez Jesús; Bobadilla Sancho Jesús; Gómez Vilda Pedro. Reconocimiento de voz y fonética acústica. Primera edición. México, D.F.: Alfaomega, 2000. ISBN 970-15-0541-7.
Arduino [2010], “Arduino”. Documento electrónico
consultado el 24/04/2013 en: http://www.arduino.cc/es/
Robot [19 de enero de 2006], “Robot”. Página web consultada 20/05/2013 en: http://www.xatakaciencia.com/robotica/el-origen-de-la-palabra-robot