Prototype of wheelchair commanded by voice using HMM in a controlled environment
Abstract
This article presents the development of a recognition system of speaker independent isolated words to command a wheelchair. Each word is encoded using techniques of Linear Prediction and Real Cepstrum, while the classification step is performed using Hidden Markov Models (HMM). From the results, commands are generated to a mobile system (wheelchair), which is led in a controlled environment.
Keywords
hidden markov models, speech processing, linear prediction, cepstrum
References
- Alcubierre J.M., Mínguez J., Montesano L., Montano L.,
- Saz 2º., Lleida 2E. (2005) Silla de Ruedas Inteligente
- Controlada por Voz. Primer Congreso Internacional de Domótica, Robótica y Teleasistencia para todos. Fundación ONCE, Madrid,
- España.
- Alonso Gonzales Itzar Goretti. (2002) Reconocedor de dígitos, Universidad de las Palmas de Gran Canaria.
- Álvarez Mauricio, Suárez Julio F., Castellanos Germán. (2003) Selección de características para el Reconocimiento de Voz con Modelos Ocultos de Markov. Universidad Nacional de Colombia, Sede Manizales.
- Burton David K., (1987) Text-Dependent Speaker Verification
- Using Vector Quantization Source Coding, IEEE Transactions on Speech and Audio Processing, Vol. 35, No. 2. Doi: 10.1109/
- TASSP.1987.1165110.
- Cabas Vanegas Edgar de Jesús, Barrera Alarcón Yecid Fernando (2004). Diseño e Implementación de un Prototipo que realice la Verificación Automática de Personas por su Voz. Tesis de grado.
- Ingeniería Electrónica, Universidad Pedagógica y Tecnológica de Colombia, Seccional Sogamoso.
- Larunbat B. (2006) Cuantificación Vectorial, Instituto de
- Ingeniería Eléctrica - Facultad de Ingeniería - Montevideo, Uruguay.
- Deller John R., Proakis G., Hansen H.L., (1993) Discretetime processing of speech signals, Prentice-Hall.
- Departamento de Ingeniería Electrónica y Comunicaciones Centro Politécnico Superior Universidad de Zaragoza, (2006). Tecnologías de la voz, Práctica IV, Análisis y Síntesis LPC de la señal de voz.
- Faundez Zanuy Marcos, (2001) Tratamiento digital de voz e imagen, Marcombo Editores.
- Gold Ben., Morgan Nelson. (2011), Speech And Audio Signal Processing, Processing and Perception of Speech and Music, John Wiley & Sons, Inc.
- Hasegawa-Johnson Mark, (2000) Lecture Notes inSpeech Production, Speech Coding, and Speech Recognition. University of Illinois at Urbana-Champaign.
- Maldonado José Luciano (2003) La estadística como herramienta
- para el desarrollo de sistemas automáticos reconocedores del habla. Instituto de Estadística Aplicada y Computación Facultad de
- Ciencias Económicas y Sociales Universidad de Los Andes.
- Martínez Fernando, Portale Gustavo, Klein Hernán, Olmos Osvaldo. (2006), Reconocimiento de voz, apuntes de cátedra para Introducción a la Inteligencia Artificial. Universidad Tecnológica Nacional.
- Méndez Ortiz Freddy, Vecino Pico Hugo. (2006) Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz. Grupo de tecnologías de información, Universidad Autónoma de Bucaramanga.
- Moralejo, L. Ostermann, S. Sanz, C. (2010) Adaptación a Jclic para alumnos con deficiencia motriz, mediante comandos por voz. Memorias Virtual Educa 2010, Santo Domingo, República Dominicana.
- Rabiner L.R., (1989) “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition,” Proceedings of the IEEE, vol. 77, no. 2. Pp. 257-286.
- DOI: 101109/5.18626 http://dx.doi.org/10.1109/5.18626
- SAITO Shuko, Nakata Kazuo. (1981), Fundamentals of Speech Signal Processing, Academic Press.
- SMITH Sreven W. (1999), “The Scientist and Engineer’s Guide to Digital Signal Processing”. 2da. edición, San Diego CA. California Technical Publishing.
- Villamil Espinosa Iván Horacio. (2005). Aplicaciones en Reconocimiento de Voz Utilizando HTK. Trabajo de grado, Departamento de electrónica. Pontificia Universidad Javeriana Colombia. de grado, Departamento de electrónica. Pontificia
- Universidad Javeriana Colombia.
Downloads
Download data is not yet available.