Detección de dificultades en la lectura utilizando reconocimiento de patrones en el habla para la detección temprana de la dislexia
DOI:
https://doi.org/10.24054/rcta.v1i39.1370Palabras clave:
Dislexia, Reconocimiento del Habla, Reconocimiento de Patrones, Redes NeuronalesResumen
En el presente artículo se presentan los resultados de una comparación de tres técnicas de reconocimiento de patrones aplicados en la clasificación de palabras aisladas que puedan simular errores comunes que ocurran en la lectura en voz alta de niños que padecen de dislexia en la etapa inicial de la lectura. Se hizo una base de datos con grabaciones extraídas de cinco locutores diferentes y muestreadas a una tasa de 16 kHz, la cual fue extendida utilizando aumento artificial de los datos. Las grabaciones fueron preprocesadas para eliminar el ruido y de estas fueron extraídos los MFCC. Se compara el rendimiento de los modelos de K-vecinos más cercanos (KNN), Perceptrón MultiCapa (MLP) y Redes Neuronales Convolucionales (CNN); obteniendo resultados del orden de 99 puntos para el reconocimiento de palabras distintivas, y resultados del orden de los 70 puntos para palabras fonéticamente similares
Descargas
Citas
speech and signal processing (ICASSP), pp. 4277-4280
Aggarwal, C. C. (2018). Neural networks and deep learning. Springer.
Alvarado, R., Caicedo, M. y Gelvez, M. (2019). Los DBA: “Herramienta Pedagógica para la intervención de las dificultades de aprendizaje en la lectura”. Universidad de Pamplona.
Bastos, V. (1983). La Dislexia y su Tratamiento.
Camacho C, C. (2016). Desarrollo de un Sistema de reconocimiento de habla natural basado en redes naturales profundas. Universidad Autónoma de Madrid.
Dougherty, G. (2013). Pattern Recognition and Classification. Springer-Verlag New York.
Fernández, F., Llopis, A. y DeRiego, C. (2006). La dislexia: origen, diagnóstico y recuperación. (16ª edición). Madrid: Morata.
Garcia, A. P., Suarez, O., & Castellanos, W. (2016). ERAAE virtual library. Paper presented at the CHILECON 2015 - 2015 IEEE Chilean Conference on Electrical, Electronics Engineering, Information and Communication Technologies, Proceedings of IEEE Chilecon 2015, 911-916. doi:10.1109/Chilecon.2015.7404681
Gelvez, L. y Maldonado, J. (2012) Aplicación de Redes Neuronales Morfológicas al reconocimiento de vocablos simples. Revista Colombiana de Tecnologías de Avanzada, Vol. 19(1), pp. 13-20.
Hidalgo N, A. y Quilis M, M. (2012). La voz del lenguaje: fonética y fonología del español. Tirant Humanidades
Huang, J. T., Li, J., y Gong, Y. (2015). An analysis of convolutional neural networks for speech recognition. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 4989-4993.
Katagiri, S. (2003). Speech Pattern Recognition using Neural Networks. En Chow, W. y Juang, B. H. (Eds.), Pattern Recognition in Speech and Language Processing CRC Press LCC. pp. 115-147.
Kubanek M, Bobulski J, y Kulawik J. (2019) A Method of Speech Coding for Speech Recognition Using a Convolutional Neural Network. Symmetry. Vol. 11(9), pp. 1185.
McFee, B., Raffel, C., Liang, D., P.W. Ellis, D., McVicar, M., Battenberg, E. y Nieto, Oriol. (2015). librosa: Audio and Music Signal Analysis in Python. Proceedings of the 14th Python in Science Conference (SCIPY 2015).
Quintana, C. (2021). Detección de dificultades en la lectura inicial en niños de primer y segundo grado de Básica Primaria utilizando reconocimiento de patrones en el habla para la detección temprana de la dislexia. Universidad de Pamplona
Rabiner, L. y Juang, B. H. (1996). Fundamentals of Speech Recognition. Prentice-Hall International Inc.
Sen, S., Dutta, A. y Dey, Nilanjam. (2019). Audio Processing and Speech Recognition. Springer.
Suarez, O. J., Díaz, N. H., & Garcia, A. P. (2020). A real-time pattern recognition module via matlab-arduino interface. Paper presented at the Proceedings of the LACCEI International Multi-Conference for Engineering, Education and Technology, doi:10.18687/LACCEI2020.1.1.646
The International Dyslexia Association (IDA). Dyslexia Basics. https://dyslexiaida.org/ dyslexia-basics/. (10 de noviembre de 2021).
Brownlee, J. (26 de agosto de 2020). Train-Test Split for Evaluating Machine Learning Algorithms. Machine Learning Mastery. https://machinelearningmastery.com/train- test-split-for-evaluating-machine-learning- algorithms/. (10 de noviembre de 2021).
Smith, J. (2011). Spectral Audio Signal Processing. WK3 Publishing. http://ccrma.stanford.edu/~jos/sasp/. (10 de noviembre de 2021).
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 REVISTA COLOMBIANA DE TECNOLOGIAS DE AVANZADA (RCTA)
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.