Aplicación de árboles de decisión para predecir el desempeño en lectura crítica
Resumen
En Colombia, todos los estudiantes de pregrado, sin importar el programa de formación profesional que cursen, deben presentar las pruebas de competencias genéricas del examen Saber Pro que incluyen: Lectura Crítica, Razonamiento Cuantitativo, Competencias Ciudadanas, Comunicación Escrita e inglés. En este artículo se presenta la aplicación de la técnica de clasificación basada en árboles de decisión para predecir el desempeño en la prueba de Lectura Crítica del examen Saber Pro que presentaron los estudiantes de la Pontificia Universidad Javeriana Cali en los años 2017 y 2018. Se utilizó la metodología CRISP-DM. A partir de los datos socioeconómicos, académicos e institucionales almacenados en las bases de datos del ICFES, se construyó, limpio y transformó un repositorio de datos. Se obtuvo una vista minable compuesta por 2052 registros y 17 atributos. Se utilizó el algoritmo J48 de la herramienta Weka para construir el árbol de decisión. De acuerdo con los resultados obtenidos, se destacaron los programas de Filosofía, Matemáticas Aplicadas y Medicina por tener el mejor desempeño en esta prueba. Entre las variables predictoras asociadas al desempeño en la competencia de Lectura Crítica, están la facultad, el grupo etario y el índice de transporte del estudiante, como tres variables importantes relacionadas al buen o bajo desempeño académico de los estudiantes de la Universidad Javeriana Cali. El conocimiento generado en esta investigación, se constituye en información de calidad para soportar la toma de decisiones de las directivas universitarias en vía del mejoramiento de la calidad de la educación superior que se brinda en esta institución.
Palabras clave
algoritmo J48, árboles de decisión, desempeño académico, lectura crítica, Saber Pro
Biografía del autor/a
Andrea Timaran-Buchely
Roles: Curaci´´on de datos, Análisis Formal, Investigación, Metodología, Escritura – borrador original, Escritura – revisión y edición.
Silvio-Ricardo Timarán-Pereira
Roles: Análisis Formal, Investigación, Escritura – revisión y edición.
Arsenio Hidalgo-Troya
Roles: Análisis Formal, Investigación, Escritura – revisión y edición.
Citas
- Icfes, Saber Pro: Módulos de Competencias Genéricas 2017. Instituto Colombiano para la Evaluación de la Educación Superior, Bogotá D.C., Colombia, 2017. https://www.icfes.gov.co/documents/20143/495161/Guia%20de%20orientacion%20modulos%20de%20competencias%20genericas-saber-pro-2017.pdf
- Icfes, Guía de orientación Saber Pro: Módulos de competencias genéricas, Bogotá D.C., Colombia, 2018. https://www.icfes.gov.co/documents/20143/496194/Guia%20de%20orientacion%20modulos%20de%20competencias%20genericas-saber-pro-2018.pdf
- R. Timarán, I. Hernández, J. Caicedo, A. Hidalgo, J. Alvarado, Descubrimiento de patrones de desempeño académico, Bogotá, Colombia: Ediciones Universidad Cooperativa de Colombia, 2016. DOI: https://doi.org/10.16925/9789587600490 DOI: https://doi.org/10.16925/9789587600490
- Icfes, Informe nacional de resultados Saber Pro 2012-2015, Bogotá D.C., Colombia, 2016. https://www.icfes.gov.co/documents/20143/194324/Informe%20nacional%20de%20resultados%20saber%20pro%202012%20-%202015.pdf
- L. Zapata, Factores académicos asociados al bajo rendimiento en inglés en las pruebas ECAES presentadas por los estudiantes de la Facultad de Educación en el año 2009, Grade Thesis, Fundación Universitaria Luis Amigó, Medellín, Colombia, 2011
- UNAL, Análisis de los resultados obtenidos por la Universidad Nacional de Colombia sede Bogotá en las pruebas Saber Pro 2011–2, Bogotá D.C., Colombia, 2012. https://www.unal.edu.co/diracad/evaluacion/SaberPro_2012/analisis_de_resultados.pdf
- R. Timarán, A. Calderón, J. Jiménez, Detección de Patrones de Deserción Estudiantil con Minería de Datos, San Juan de Pasto, Colombia: Editorial Universidad de Nariño, 2017
- S. Valero, A. Vargas, M. Alonso, Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el algoritmo de los k vecinos más cercanos, 2005. http://fcaenlinea.unam.mx/anexos/1566/1566_u6_act1b.pdf.
- H. Escobar, M. Alcívar, C. Márquez, C. Escobar, “Implementación de Minería de Datos en la Gestión Académica de las Instituciones de Educación Superior,” Didasc@lia: Didáctica y Educación, vol. 8, no. 3, pp. 203-212, 2017
- A. Azevedo, M. Santos, “KDD, SEMMA and CRISP-DM: a parallel overview,” in Proceedings of IADIS European Conference on Data Mining, pp. 182-185, 2008
- J. Villena, CRISP-DM: La metodología para poner orden en los proyectos de Data Science, 2016. https://data.sngular.team/es/art/25/crisp-dm-la-metodologia-para-poner-orden-en-los-proyectos-de-data-science
- J. Hernández, M. Ramírez, C. Ferri, Introducción a la Minería de Datos. Madrid, España: Editorial Pearson Educación S.A., 2005
- J. Han, M. Kamber, Data Mining: Concepts and Techniques. San Francisco, USA: Morgan Kaufmann Publishers, 2001
- K. Sattler, O. Dunemann, “SQL Database Primitives for Decision Tree Classifiers,” in 10th ACM International Conference on Information and Knowledge Management, pp. 379-386, 2001 DOI: https://doi.org/10.1145/502585.502650
- R. Timarán, J. Caicedo, A. Hidalgo, Aplicación de la minería de datos en la detección de patrones de desempeño académico en las pruebas Saber Pro, San Juan de Pasto, Colombia: Editorial Universidad de Nariño, 2021
- E. Hernández, R. Lorente, Minería de datos aplicada a la detección de Cáncer de Mama. Universidad Carlos III, Madrid, Spain, 2009. http://www.it.uc3m.es/jvillena/irc/practicas/08-09/14.pdf
- I. Witten, E. Frank, M. Hall, Data Mining: Practical Machine Learning Tools and Techniques (Third Edition). New York, USA: Morgan Kaufmann, 2011. DOI: https://doi.org/10.1016/C2009-0-19715-5 DOI: https://doi.org/10.1016/C2009-0-19715-5
- J. R. Quinlan, Programs for Machine Learning. San Francisco, USA: Morgan Kaufmann Publishers, 1993
- M. García, A. Álvarez, Análisis de Datos en WEKA: Pruebas de Selectividad, 2010. http://www.it.uc3m.es/jvillena/irc/practicas/06-07/28.pdf