Ir al menú de navegación principal Ir al contenido principal Ir al pie de página del sitio

Prototipo de silla de ruedas comandada por voz empleando hmm en un ambiente controlado

Resumen

Este artículo presenta el desarrollo de un sistema de reconocimiento de palabras aisladas independiente del locutor, para comandar una silla de ruedas. Cada palabra se codifica mediante las técnicas de Predicción lineal y Cepstrum real, y la etapa de clasificación se realiza mediante Modelos Ocultos de Markov (HMM). A partir de los resultados se generan órdenes a un sistema móvil (silla de ruedas), el cual es comandado en un ambiente controlado.

Palabras clave

modelos Ocultos de markov, procesamiento de voz, predicción lineal, Cepstrum

PDF

Referencias

  • Alcubierre J.M., Mínguez J., Montesano L., Montano L.,
  • Saz 2º., Lleida 2E. (2005) Silla de Ruedas Inteligente
  • Controlada por Voz. Primer Congreso Internacional de Domótica, Robótica y Teleasistencia para todos. Fundación ONCE, Madrid,
  • España.
  • Alonso Gonzales Itzar Goretti. (2002) Reconocedor de dígitos, Universidad de las Palmas de Gran Canaria.
  • Álvarez Mauricio, Suárez Julio F., Castellanos Germán. (2003) Selección de características para el Reconocimiento de Voz con Modelos Ocultos de Markov. Universidad Nacional de Colombia, Sede Manizales.
  • Burton David K., (1987) Text-Dependent Speaker Verification
  • Using Vector Quantization Source Coding, IEEE Transactions on Speech and Audio Processing, Vol. 35, No. 2. Doi: 10.1109/
  • TASSP.1987.1165110.
  • Cabas Vanegas Edgar de Jesús, Barrera Alarcón Yecid Fernando (2004). Diseño e Implementación de un Prototipo que realice la Verificación Automática de Personas por su Voz. Tesis de grado.
  • Ingeniería Electrónica, Universidad Pedagógica y Tecnológica de Colombia, Seccional Sogamoso.
  • Larunbat B. (2006) Cuantificación Vectorial, Instituto de
  • Ingeniería Eléctrica - Facultad de Ingeniería - Montevideo, Uruguay.
  • Deller John R., Proakis G., Hansen H.L., (1993) Discretetime processing of speech signals, Prentice-Hall.
  • Departamento de Ingeniería Electrónica y Comunicaciones Centro Politécnico Superior Universidad de Zaragoza, (2006). Tecnologías de la voz, Práctica IV, Análisis y Síntesis LPC de la señal de voz.
  • Faundez Zanuy Marcos, (2001) Tratamiento digital de voz e imagen, Marcombo Editores.
  • Gold Ben., Morgan Nelson. (2011), Speech And Audio Signal Processing, Processing and Perception of Speech and Music, John Wiley & Sons, Inc.
  • Hasegawa-Johnson Mark, (2000) Lecture Notes inSpeech Production, Speech Coding, and Speech Recognition. University of Illinois at Urbana-Champaign.
  • Maldonado José Luciano (2003) La estadística como herramienta
  • para el desarrollo de sistemas automáticos reconocedores del habla. Instituto de Estadística Aplicada y Computación Facultad de
  • Ciencias Económicas y Sociales Universidad de Los Andes.
  • Martínez Fernando, Portale Gustavo, Klein Hernán, Olmos Osvaldo. (2006), Reconocimiento de voz, apuntes de cátedra para Introducción a la Inteligencia Artificial. Universidad Tecnológica Nacional.
  • Méndez Ortiz Freddy, Vecino Pico Hugo. (2006) Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz. Grupo de tecnologías de información, Universidad Autónoma de Bucaramanga.
  • Moralejo, L. Ostermann, S. Sanz, C. (2010) Adaptación a Jclic para alumnos con deficiencia motriz, mediante comandos por voz. Memorias Virtual Educa 2010, Santo Domingo, República Dominicana.
  • Rabiner L.R., (1989) “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition,” Proceedings of the IEEE, vol. 77, no. 2. Pp. 257-286.
  • DOI: 101109/5.18626 http://dx.doi.org/10.1109/5.18626
  • SAITO Shuko, Nakata Kazuo. (1981), Fundamentals of Speech Signal Processing, Academic Press.
  • SMITH Sreven W. (1999), “The Scientist and Engineer’s Guide to Digital Signal Processing”. 2da. edición, San Diego CA. California Technical Publishing.
  • Villamil Espinosa Iván Horacio. (2005). Aplicaciones en Reconocimiento de Voz Utilizando HTK. Trabajo de grado, Departamento de electrónica. Pontificia Universidad Javeriana Colombia. de grado, Departamento de electrónica. Pontificia
  • Universidad Javeriana Colombia.

Descargas

Los datos de descargas todavía no están disponibles.