Ir al contenido

Documat


Resumen de Predicción del fracaso y abandono escolar mediante técnica de minería de datos

Carlos Márquez Vera

  • RESUMEN DE LA TESIS DOCTORAL DE D. Carlos Márquez Vera 1. Introducción o motivación de la tesis.

    Este trabajo aborda el problema del fracaso escolar de los estudiantes, el cual es reconocido como un problema multifactorial. Dicho problema se presenta en muchas instituciones educativas de todas partes del mundo, especialmente en niveles de educación media o superior, donde hay una cantidad importante de estudiantes que no aprueban sus materias o que abandonan sus estudios. En la actualidad una de las prioridades de las instituciones educativas es reducir este problema debido a las repercusiones que tiene desde diferentes puntos de vista como el educativo, el social y el económico.

    El Programa II de la Unidad Académica Preparatoria de la Universidad Autónoma de Zacatecas, institución educativa mexicana del nivel medio superior, tiene índices de reprobación y abandono altos, los cuales son mayores en el primer semestre y disminuyen a niveles aceptables en los siguientes. Es entonces motivo de estudio reducir los índices mencionados en los estudiantes del primer semestre, lo cual puede hacerse a través de buscar predecir de manera confiable a aquellos estudiantes en riesgo de suspender o abandonar la escuela, para lo cual se puede utilizar la Minería de Datos, misma que está siendo utilizada en diferentes áreas con resultados excelentes. Si se conoce oportunamente mediante el uso de la Minería de Datos, cuáles son los estudiantes en riesgo, entonces la institución puede implementar acciones que puedan apoyarlos de distintas maneras y así tratar de disminuir el fracaso escolar.

    2. Contenido de la investigación Esta tesis hace una revisión del estado del problema del fracaso escolar de los estudiantes y del estado que guarda la Minería de Datos Educativa. Se propone una metodología para predecir a los alumnos que se encuentran en riesgo de abandonar o reprobar, utilizando diferentes técnicas de Minería de Datos. El objetivo es obtener un modelo de predicción lo más preciso posible, el cual pueda usarse en generaciones futuras para reducir la reprobación y el abandono escolar. Se usa un algoritmo de programación genética y otras técnicas de Minería de Datos para resolver el problema de predecir a los estudiantes que fracasan a su paso por la escuela. Se utiliza información real, obtenida de estudiantes de México. Primeramente se realiza una selección de los mejores atributos con el fin de reducir el problema de la alta dimensionalidad del conjunto de datos. Para resolver el desbalanceo de la información, se realiza un rebalanceo de datos y una clasificación considerando diferentes costos. Después se usa un algoritmo basado en programación genética y se compara su efectividad con otros algoritmos de tipo ¿caja blanca¿, con la finalidad de obtener modelos de clasificación muy comprensibles. Finalmente, las salidas de los algoritmos se muestran y comparan para seleccionar aquéllas que con mayor precisión clasifican a los estudiantes que pueden reprobar o abandonar.

    Se propone otra metodología también basada en técnicas de Minería de Datos para predecir lo más temprano posible a aquéllos estudiantes que estén en riesgo de suspender o abandonar, es decir, sentar las bases para que se pueda implementar un Sistema de Alerta Temprana, para una vez detectados poder tomar decisiones en cuanto a qué tipo de apoyo o intervención requiere cada uno de ellos para en lo posible impedir el fracaso, o bien, reducirlo y retener a los estudiantes en la escuela. Se realizaron diferentes pruebas experimentales con datos reales de la misma institución educativa de México. Se fue agrupando la información de los estudiantes tal y como se fue recogiendo en las diferentes etapas o momentos del periodo escolar. Después, para cada etapa se ha realizado una selección de los atributos de los estudiantes que más influencia tienen en ellos para abandonar la escuela. Entonces se aplicaron a los datos disponibles en cada etapa varios algoritmos de clasificación clásicos además de un algoritmo genético. Finalmente, se han comparado los resultados de clasificación que obtienen y se muestran algunos modelos obtenidos.

    3. Conclusión Este trabajo explica cómo se puede predecir a los estudiantes en riesgo de reprobar o abandonar sus estudios. Se muestra que esto se consigue fundamentalmente a través de recoger información de los alumnos, sin embargo, es imposible desarrollar un método infalible, que pueda predecir a la totalidad de los estudiantes que fracasan; siempre hay situaciones que no se pueden predecir y que pueden llevar a los estudiantes a su fracaso. Por otro lado, también se pueden dar los casos en los que los estudiantes en riesgo son detectados, ellos lo saben, la escuela les ofrece el apoyo que requieren para evitar su fracaso y no están interesados en permanecer en la escuela y simplemente dejan que termine el periodo escolar para no regresar más. Lo anterior suele presentarse en el nivel medio superior de educación, probablemente por la etapa que viven estos estudiantes, los cuales, en su mayoría tienen entre quince y dieciocho años de edad. Así entonces, es imposible terminar con el fracaso escolar de los estudiantes, sin embargo, trabajos como éste, tributan a tratar de reducir el problema.


Fundación Dialnet

Mi Documat