Desarrollo de un sistema de comunicación silenciosa dual basado en habla subvocal y Raspberry Pi
Resumen
Presenta una metodología novedosa para establecer una comunicación silenciosa dual basada en habla subvocal, para ello se desarrollaron dos sistemas electrónicos que registran las señales bioeléctricas que llegan al aparato fonador, generadas al momento de realizar el proceso de lectura silenciosa por el individuo. Estos sistemas están basados en tres etapas fundamentales, la primera es la de adquisición, encargada de extraer, acondicionar, codificar y transmitir las señales electromiográficas del habla subvocal hacia la segunda etapa, denominada de procesamiento, en esta etapa, implementada en un sistema Raspberry Pi, se desarrollaron los procesos de almacenamiento, acondicionamiento, extracción de patrones y clasificación de palabras, utilizando técnicas matemáticas como: Entropía, análisis Wavelet y Máquinas de Soporte Vectorial de Mínimos Cuadrados, implementadas bajo el entorno libre de programación Python, finalmente, la última etapa del sistema se encargó de comunicar inalámbricamente los dos sistemas electrónicos, utilizando 4 clases de señales, para clasificar las palabras hola, intruso, ¿hola cómo estás? y tengo frío.
Adicionalmente, en este artículo se muestra la implementación del sistema para el registro de señales de habla subvocal. El porcentaje de acierto promedio general es de 72.5 %. Se incluyen un total de 50 palabras por clase, es decir, 200 señales. Finalmente, se pudo demostrar que usando una Raspberry Pi es posible establecer un sistema de comunicación silenciosa a partir de las señales del habla subvocal.
Palabras clave
comunicación silenciosa, entropía, habla subvocal, MSV (Máquinas de Soporte Vectorial), Raspberry Pi, Wavelet
Citas
- C. Jorgensen and K. Binsted, "Web Browser Control Using EMG Based Sub Vocal Speech Recognition," in Proceedings of the 38th Annual Hawaii International Conference on System Sciences, p. 294c, Jan. 2005. DOI: http://dx.doi.org/10.1109/HICSS.2005.683. DOI: https://doi.org/10.1109/HICSS.2005.683
- J. Mendes, R. Robson, S. Labidi, and A. Barros, "Subvocal Speech Recognition Based on EMG Signal Using Independent Component Analysis and Neural Network MLP," in Congress on Image and Signal Processing, vol. 1, pp. 221-224, May. 2008. DOI: http://dx.doi.org/10.1109/cisp.2008.741. DOI: https://doi.org/10.1109/CISP.2008.741
- H. Curtis and L. F. Petrinovich, "Treatment of Subvo-cal Speech During Reading," Journal of Reading, vol. 12 (5), pp. 361-368, Feb. 1969.
- E. N. Gamma, D. Amaya, and O. L. Ramos, "Revisión de las tecnologías y aplicaciones del habla subvocal," Ingeniería, vol. 20 (2), pp. 277-288, 2015. DOI: http://dx.doi.org/10.14483/udistrital.jour.reving.2015.2.a07. DOI: https://doi.org/10.14483/23448393.8513
- J. A. Gutiérrez, E. N. Gamma, D. Amaya, and O. F. Avilés, "Desarrollo de interfaces para la detección del habla sub-vocal," Tecnura, vol. 17(37), pp. 138 - 152, Jul. 2013. DOI: http://dx.doi.org/10.14483/udistrital.jour.tecnura.2013.3.a12. DOI: https://doi.org/10.14483/udistrital.jour.tecnura.2013.3.a12
- R. Merletti and P. Philip A, Electromyography Physiology, Engineering, and Noninvasive Applications, 2004. DOI: https://doi.org/10.1002/0471678384
- J. Peña Rodriguez and L. E. Mendoza, Adquisición y procesamiento de señales electromiográficas basadas en habla subvocal, Pamplona, Dec. 2010.
- L. E. Mendoza, J. Peña, L. A. Muñoz-Bedoya, and H. J. Velandia-Villamizar, "Procesamiento de señales provenientes del habla subvocal usando Wavelet Packet y Redes Neuronales," Tecno. Lógicas, vol. Edición Especial 2013, pp. 655-667, Oct. 2013. DOI: https://doi.org/10.22430/22565337.371
- I. Ishii, S. Takemoto, T. Takaki, M. Takamoto, K. Imon, and K. Hirakawa, "Real-time laryngoscopic measurements of vocal-fold vibration," in 2011 Annual International Conference of the IEEE Engineering in Medicine and Biology Society, pp. 6623-6626, Aug. 2011. DOI: http://dx.doi.org/10.1109/IEMBS.2011.6091633. DOI: https://doi.org/10.1109/IEMBS.2011.6091633
- G. Chau and G. Kemper, "One Channel Subvocal Speech Phrases Recognition Using Cumulative Residual Entropy and Support Vector Machines," IEEE Latin American Transactions, vol. 13 (7), pp. 2135-2143, Jul. 2015. DOI: http://dx.doi.org/10.1109/TLA.2015.7273769. DOI: https://doi.org/10.1109/TLA.2015.7273769
- C. Jorgensen, D. D. Lee, and S. Agabont, "Sub Auditory Speech Recognition Based on EMG Signals," Proceedings of the International Joint Conference on Neural Networks, vol. 4, pp. 3128-3133, Jul. 2003. DOI: http://dx.doi.org/10.1109/ijcnn.2003.1224072. DOI: https://doi.org/10.1109/IJCNN.2003.1224072
- L. E. Mendoza, J. Peña, and J. L. Ramón, " Electro-myographic patterns of sub-vocal Speech: Records and classification," Revista de Tecnologia, vol. 12 (2), pp. 35-41, Jul. 2013. DOI: https://doi.org/10.18270/rt.v12i2.758
- SENIAM, [en línea]. Available: http://www.seniam.org/. [acceso: 09/02/2016].
- Texas Instrument, [en línea]. Available: http://www.ti.com/lit/ds/symlink/ina128.pdf. [acceso: 23/09/2015].
- TEXAS INSTRUMENT, [en línea]. Available: http://www.ti.com/lit/ds/symlink/ads7813.pdf. [acceso: 23/09/2015].
- Raspberry Pi, [en línea]. Available: https://www.raspberrypi.org/education/. [acceso: 01/01/2014].
- C. Sidney, R. Gopinath, and H. Guo, Introduction to Wavelets and Wavelet Transforms: A Primer, Pearson, 1997.