Prototipo de silla de ruedas comandada por voz empleando hmm en un ambiente controlado

Contenido principal del artículo

Autores

Óscar Iván Higuera-Martínez
Helberth Yesid Espitia-Flórez
Diego Méndez-Medina

Resumen

Este artículo presenta el desarrollo de un sistema de reconocimiento de palabras aisladas independiente del locutor, para comandar una silla de ruedas. Cada palabra se codifica mediante las técnicas de Predicción lineal y Cepstrum real, y la etapa de clasificación se realiza mediante Modelos Ocultos de Markov (HMM). A partir de los resultados se generan órdenes a un sistema móvil (silla de ruedas), el cual es comandado en un ambiente controlado.

Palabras clave:

Detalles del artículo

Licencia

Los autores deben firmar y enviar la Autorización de evaluación y publicación del artículo suministrada por la Revista, en la cual se consignan todos los aspectos involucrados a los Derechos de Autor.

Todos los artículos de la Revista Ingeniería Investigación y Desarrollo son difundidos bajo la licencia Creative Commons de Atribución (BY).

Declaración de privacidad

Los nombres y direcciones de correo electrónico introducidos en esta revista se usarán exclusivamente para los fines establecidos en ella y no se proporcionarán a terceros o para su uso con otros fines.

Referencias

[1] Alcubierre J.M., Mínguez J., Montesano L., Montano L.,
Saz 2º., Lleida 2E. (2005) Silla de Ruedas Inteligente
Controlada por Voz. Primer Congreso Internacional de Domótica, Robótica y Teleasistencia para todos. Fundación ONCE, Madrid,
España.

[2] Alonso Gonzales Itzar Goretti. (2002) Reconocedor de dígitos, Universidad de las Palmas de Gran Canaria.

[3] Álvarez Mauricio, Suárez Julio F., Castellanos Germán. (2003) Selección de características para el Reconocimiento de Voz con Modelos Ocultos de Markov. Universidad Nacional de Colombia, Sede Manizales.

[4] Burton David K., (1987) Text-Dependent Speaker Verification
Using Vector Quantization Source Coding, IEEE Transactions on Speech and Audio Processing, Vol. 35, No. 2. Doi: 10.1109/
TASSP.1987.1165110.

[5] Cabas Vanegas Edgar de Jesús, Barrera Alarcón Yecid Fernando (2004). Diseño e Implementación de un Prototipo que realice la Verificación Automática de Personas por su Voz. Tesis de grado.
Ingeniería Electrónica, Universidad Pedagógica y Tecnológica de Colombia, Seccional Sogamoso.

[6] Larunbat B. (2006) Cuantificación Vectorial, Instituto de
Ingeniería Eléctrica - Facultad de Ingeniería - Montevideo, Uruguay.

[7] Deller John R., Proakis G., Hansen H.L., (1993) Discretetime processing of speech signals, Prentice-Hall.

[8] Departamento de Ingeniería Electrónica y Comunicaciones Centro Politécnico Superior Universidad de Zaragoza, (2006). Tecnologías de la voz, Práctica IV, Análisis y Síntesis LPC de la señal de voz.

[9] Faundez Zanuy Marcos, (2001) Tratamiento digital de voz e imagen, Marcombo Editores.

[10] Gold Ben., Morgan Nelson. (2011), Speech And Audio Signal Processing, Processing and Perception of Speech and Music, John Wiley & Sons, Inc.

[11] Hasegawa-Johnson Mark, (2000) Lecture Notes inSpeech Production, Speech Coding, and Speech Recognition. University of Illinois at Urbana-Champaign.

[12] Maldonado José Luciano (2003) La estadística como herramienta
para el desarrollo de sistemas automáticos reconocedores del habla. Instituto de Estadística Aplicada y Computación Facultad de
Ciencias Económicas y Sociales Universidad de Los Andes.

[13] Martínez Fernando, Portale Gustavo, Klein Hernán, Olmos Osvaldo. (2006), Reconocimiento de voz, apuntes de cátedra para Introducción a la Inteligencia Artificial. Universidad Tecnológica Nacional.

[14] Méndez Ortiz Freddy, Vecino Pico Hugo. (2006) Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz. Grupo de tecnologías de información, Universidad Autónoma de Bucaramanga.

[15] Moralejo, L. Ostermann, S. Sanz, C. (2010) Adaptación a Jclic para alumnos con deficiencia motriz, mediante comandos por voz. Memorias Virtual Educa 2010, Santo Domingo, República Dominicana.

[16] Rabiner L.R., (1989) “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition,” Proceedings of the IEEE, vol. 77, no. 2. Pp. 257-286.
DOI: 101109/5.18626 http://dx.doi.org/10.1109/5.18626

[17] SAITO Shuko, Nakata Kazuo. (1981), Fundamentals of Speech Signal Processing, Academic Press.

[18] SMITH Sreven W. (1999), “The Scientist and Engineer’s Guide to Digital Signal Processing”. 2da. edición, San Diego CA. California Technical Publishing.

[19] Villamil Espinosa Iván Horacio. (2005). Aplicaciones en Reconocimiento de Voz Utilizando HTK. Trabajo de grado, Departamento de electrónica. Pontificia Universidad Javeriana Colombia. de grado, Departamento de electrónica. Pontificia
Universidad Javeriana Colombia.

Descargas

La descarga de datos todavía no está disponible.