Detección de dificultades en la lectura utilizando reconocimiento de patrones en el habla para la detección temprana de la dislexia
DOI:
https://doi.org/10.24054/rcta.v1i39.1370Palabras clave:
Dislexia, Reconocimiento del Habla, Reconocimiento de Patrones, Redes NeuronalesResumen
En el presente artículo se presentan los resultados de una comparación de tres técnicas de reconocimiento de patrones aplicados en la clasificación de palabras aisladas que puedan simular errores comunes que ocurran en la lectura en voz alta de niños que padecen de dislexia en la etapa inicial de la lectura. Se hizo una base de datos con grabaciones extraídas de cinco locutores diferentes y muestreadas a una tasa de 16 kHz, la cual fue extendida utilizando aumento artificial de los datos. Las grabaciones fueron preprocesadas para eliminar el ruido y de estas fueron extraídos los MFCC. Se compara el rendimiento de los modelos de K-vecinos más cercanos (KNN), Perceptrón MultiCapa (MLP) y Redes Neuronales Convolucionales (CNN); obteniendo resultados del orden de 99 puntos para el reconocimiento de palabras distintivas, y resultados del orden de los 70 puntos para palabras fonéticamente similares
Citas
speech and signal processing (ICASSP), pp. 4277-4280
Aggarwal, C. C. (2018). Neural networks and deep learning. Springer.
Alvarado, R., Caicedo, M. y Gelvez, M. (2019). Los DBA: “Herramienta Pedagógica para la intervención de las dificultades de aprendizaje en la lectura”. Universidad de Pamplona.
Bastos, V. (1983). La Dislexia y su Tratamiento.
Camacho C, C. (2016). Desarrollo de un Sistema de reconocimiento de habla natural basado en redes naturales profundas. Universidad Autónoma de Madrid.
Dougherty, G. (2013). Pattern Recognition and Classification. Springer-Verlag New York.
Fernández, F., Llopis, A. y DeRiego, C. (2006). La dislexia: origen, diagnóstico y recuperación. (16ª edición). Madrid: Morata.
Garcia, A. P., Suarez, O., & Castellanos, W. (2016). ERAAE virtual library. Paper presented at the CHILECON 2015 - 2015 IEEE Chilean Conference on Electrical, Electronics Engineering, Information and Communication Technologies, Proceedings of IEEE Chilecon 2015, 911-916. doi:10.1109/Chilecon.2015.7404681
Gelvez, L. y Maldonado, J. (2012) Aplicación de Redes Neuronales Morfológicas al reconocimiento de vocablos simples. Revista Colombiana de Tecnologías de Avanzada, Vol. 19(1), pp. 13-20.
Hidalgo N, A. y Quilis M, M. (2012). La voz del lenguaje: fonética y fonología del español. Tirant Humanidades
Huang, J. T., Li, J., y Gong, Y. (2015). An analysis of convolutional neural networks for speech recognition. 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 4989-4993.
Katagiri, S. (2003). Speech Pattern Recognition using Neural Networks. En Chow, W. y Juang, B. H. (Eds.), Pattern Recognition in Speech and Language Processing CRC Press LCC. pp. 115-147.
Kubanek M, Bobulski J, y Kulawik J. (2019) A Method of Speech Coding for Speech Recognition Using a Convolutional Neural Network. Symmetry. Vol. 11(9), pp. 1185.
McFee, B., Raffel, C., Liang, D., P.W. Ellis, D., McVicar, M., Battenberg, E. y Nieto, Oriol. (2015). librosa: Audio and Music Signal Analysis in Python. Proceedings of the 14th Python in Science Conference (SCIPY 2015).
Quintana, C. (2021). Detección de dificultades en la lectura inicial en niños de primer y segundo grado de Básica Primaria utilizando reconocimiento de patrones en el habla para la detección temprana de la dislexia. Universidad de Pamplona
Rabiner, L. y Juang, B. H. (1996). Fundamentals of Speech Recognition. Prentice-Hall International Inc.
Sen, S., Dutta, A. y Dey, Nilanjam. (2019). Audio Processing and Speech Recognition. Springer.
Suarez, O. J., Díaz, N. H., & Garcia, A. P. (2020). A real-time pattern recognition module via matlab-arduino interface. Paper presented at the Proceedings of the LACCEI International Multi-Conference for Engineering, Education and Technology, doi:10.18687/LACCEI2020.1.1.646
The International Dyslexia Association (IDA). Dyslexia Basics. https://dyslexiaida.org/ dyslexia-basics/. (10 de noviembre de 2021).
Brownlee, J. (26 de agosto de 2020). Train-Test Split for Evaluating Machine Learning Algorithms. Machine Learning Mastery. https://machinelearningmastery.com/train- test-split-for-evaluating-machine-learning- algorithms/. (10 de noviembre de 2021).
Smith, J. (2011). Spectral Audio Signal Processing. WK3 Publishing. http://ccrma.stanford.edu/~jos/sasp/. (10 de noviembre de 2021).
Descargas
Publicado
Versiones
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 REVISTA COLOMBIANA DE TECNOLOGIAS DE AVANZADA (RCTA)
![Creative Commons License](http://i.creativecommons.org/l/by-nc/4.0/88x31.png)
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Los autores que publiquen en esta revista aceptan las siguientes condiciones:
-
Los autores conservan los derechos morales de autor y otorgan a la revista el derecho de la primera publicación del trabajo. Este trabajo se licencia bajo la Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0 DEED), que permite a terceros utilizar el trabajo siempre que se dé crédito adecuado a los autores y a la primera publicación en esta revista. No se permite el uso comercial de la obra y no se pueden crear obras derivadas.
-
Los autores pueden celebrar acuerdos contractuales adicionales e independientes para la distribución no exclusiva de la versión del artículo publicado en esta revista (por ejemplo, incluirlo en un repositorio institucional o publicarlo en un libro), siempre que se indique claramente que el trabajo se publicó por primera vez en esta revista.
-
Se permite y se recomienda a los autores publicar su trabajo en Internet (por ejemplo, en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado.