Aplicación de machine learning y metodología CRISP-DM para la clasificación precisa de severidad en casos de dengue

Autores/as

DOI:

https://doi.org/10.24054/rcta.v1i43.2822

Palabras clave:

Ciencia de Datos, CRISP-DM, Dengue, Machine Learning

Resumen

El proyecto se centra en clasificar con precisión la severidad de los casos de Dengue en Casanare, Colombia, utilizando Machine Learning (ML) y la metodología CRISP-DM. La variable objetivo es “clasificación final”, que categoriza los casos en dengue sin signos de alarma y con signos de alarma. Se probaron varios modelos y técnicas, destacando 'RandomForest' como el más efectivo debido a su alto rendimiento, alcanzando una precisión del 100%. La mejora en la clasificación permitirá una identificación temprana y precisa de la gravedad de los casos, lo que, a su vez, puede mejorar la atención médica y las estrategias de intervención. Se utilizo la base de datos “Casos de Dengue en Casanare por servicio hospitalario, relación tipo de persona, síntomas y estado hospitalario” para respaldar el análisis.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Carlos Alberto Mejia Rodriguez, Universidad Popular del Cesar

Ingeniero de Sistemas, Especialista en informática Educativa, Magister en E-learning. Miembro del Grupo de Investigación GIDEATIC.

Miguel Alberto Rincon Pinzon, Universidad Popular del Cesar

Ingeniero de Sistemas, Licenciado en Lengua Extranjera: inglés, Magister en Gestión de la Tecnología Educativa. Líder del Grupo de Investigación GIDEATIC categorizado en C avalado por la Universidad Popular del Cesar.

Luis Manuel Palmera Quintero, Universidad Popular del Cesar

Ingeniero de Sistemas, Magíster en Gobierno en Tecnologías de la información.

Lina Marcela Arevalo Vergel, Universidad popular del cesar

Ingeniera Industrial, Esp. Salud Ocupacional, Esp. Gerencia de Proyectos, Esp. Tecnologías digitales aplicadas a la educación Docente investigador Grupo de Investigación GIDEATIC.

Citas

Medina L., E. H. Big Data: Los Datos como Generadores de Valor. Universidad Peruana de Ciencias Aplicadas. 2023.

Casas R., J., Nin G., J., & Julbe L., F. (2019). Big data: análisis de datos en entornos masivos. Editorial UOC.

López M., J. J. y Zarza, G. (2017). La ingeniería del big data: cómo trabajar con datos. Editorial UOC. Barcelona, España.

Maldonado, S. (2022). Analytics y Big Data: ciencia de los Datos aplicada al mundo de los negocios. RIL editores.

Suarez L, A. A., Vazquez S., C. R., & Huffel, S. Van. (2018). Machine learning approaches for ambulatory electrocardiography signal processing.

Rios Insua, D., & Gomez-Ullate Oteiza, D. (2019). Big data: conceptos, tecnologias y aplicaciones. Editorial CSIC Consejo Superior de Investigaciones Cientificas.

Arnst, M., Louppe, G., Van Hulle, R., Gillet, L., Bureau, F., & Denoel, V. (2022). A hybrid stochastic model and its Bayesian identification for infectious disease screening in a university campus with application to massive COVID-19 screening at the University of Liège. Mathematical Biosciences, 347. https://doi.org/10.1016/j.mbs.2022.108805

Gutierrez-Barbosa, H., Medina-Moreno, S., Zapata, J. C., & Chua, J. V. (2020). Dengue Infections in Colombia: Epidemiological Trends of a Hyperendemic Country. Tropical Medicine and Infectious Disease, 5(4).

Gangula, R., Thirupathi, L., Parupati, R., Sreeveda, K., & Gattoju, S. (2023). Ensemble machine learning based prediction of dengue disease with performance and accuracy elevation patterns. Materials Today: Proceedings, 80, 3458–3463. https://doi.org/10.1016/j.matpr.2021.07.270

Castillo Romero, J. A. (2019). Big data. IFCT128PO. IC Editorial.

Organización Mundial de La Salud. (2023). Dengue y dengue grave. WHO.

Kadenic, M. D., Koumaditis, K., & Junker-Jensen, L. (2023). Mastering scrum with a focus on team maturity and key components of scrum. Information and Software Technology, 153, 107079. https://doi.org/10.1016/j.infsof.2022.107079

Treatments for dengue: a Global Dengue Alliance to address unmet needs. (2023). The Lancet Global Health. https://doi.org/10.1016/S2214-109X(23)00362-5

Nariya, M. K., Mills, C. E., Sorger, P. K., & Sokolov, A. (2023). Paired evaluation of machine-learning models characterizes effects of confounders and outliers. Patterns, 4(8), 100791. https://doi.org/10.1016/j.patter.2023.100791-

Menoyo R., D., Garcia L., E., & Garcia C., A. (2021). Fundamentos de la ciencia de datos. Editorial Universidad de Alcala.

Minguillon, J., Casas, J., & Minguillon, J. (2017). Mineria de datos: modelos y algoritmos. Editorial UOC.

Kotu, V., & Deshpande, B. (2019). Chapter 14 - Feature Selection. In V. Kotu & B. Deshpande (Eds.), Data Science (Second Edition) (pp. 467–490). Morgan Kaufmann. https://doi.org/10.1016/B978-0-12-814761-0.00014-9

Caballero, R., & Martin, E. (2022). Las bases de big data y de la inteligencia artificial. Los libros de la Catarata.

Edgar, T. W., & Manz, D. O. (2017). Chapter 4 - Exploratory Study. In T. W. Edgar & D. O. Manz (Eds.), Research Methods for Cyber Security (pp. 95–130). Syngress. https://doi.org/10.1016/B978-0-12-805349-2.00004-2

Denoux, T., Kanjanatarakul, O., & Sriboonchitta, S. (2019). A new evidential K-nearest neighbor rule based on contextual discounting with partially supervised learning. International Journal of Approximate Reasoning, 113, 287–302. https://doi.org/10.1016/j.ijar.2019.07.009

Malik, A., Javeri, Y. T., Shah, M., & Mangrulkar, R. (2022). Chapter 11 - Impact analysis of COVID-19 news headlines on global economy. In R. C. Poonia, B. Agarwal, S. Kumar, M. S. Khan, G. Marques, & J. Nayak (Eds.), Cyber-Physical Systems (pp. 189–206). Academic Press. https://doi.org/10.1016/B978-0-12-824557-6.00001-7

Archivos adicionales

Publicado

2024-03-16 — Actualizado el 2024-03-16

Cómo citar

[1]
C. A. Mejia Rodriguez, M. A. Rincon Pinzon, L. M. Palmera Quintero, y L. M. Arevalo Vergel, «Aplicación de machine learning y metodología CRISP-DM para la clasificación precisa de severidad en casos de dengue», RCTA, vol. 1, n.º 43, pp. 78–85, mar. 2024.

Número

Sección

Artículos