Ir al contenido

Documat


Resumen de Modelos gráficos probabilísticos aplicados a la predicción del rendimiento en educación

Byron Oviedo Bayas

  • Uno de los principales problemas en las universidades tiene que ver con los altos índices de deserción académica. Este es un problema que debe ser investigado y tratado con prioridad ya que se ha constituido como un indicador de eficiencia dentro de las instituciones de educación superior. Se puede indicar que la estimación de la deserción estudiantil es una tarea compleja y difícil y que ha sido necesario utilizar métodos que usan una combinación de factores (clasificadores bayesianos) para poder obtener algunas mejoras sobre los clasificadores triviales.

    Para llevar a cabo la presente investigación se utilizó con un conjunto de datos socio-económicos de los estudiantes legalmente matriculados en el periodo 20122013 en las diferentes carreras de la Facultad de Ciencias de la Ingeniería de la Universidad Técnica Estatal de Quevedo, en Ecuador. De igual manera, se trabajó con las bases de datos del repositorio de la UCI referente a las encuestas de evaluación docente por parte de los estudiantes de dos escuelas secundarias de Portugal en los cursos de matemáticas y lengua portuguesa.

    Entre las diferentes técnicas computacionales que existen para realizar análisis inteligente de datos, los modelos gráficos específicamente las redes bayesianas permiten estudiar, de forma sencilla, las principales relaciones entre las variables involucradas en un sistema complejo. Una de las razones del éxito de las redes bayesianas es que se pueden aprender a partir de datos; éste es un proceso de aprendizaje que se divide en dos etapas: el aprendizaje estructural y el aprendi zaje paramétrico. La primera de ellas consiste en obtener la estructura de la red bayesiana, es decir, las relaciones de dependencia e independencia entre las variables involucradas. La segunda etapa tiene como finalidad obtener las probabilidades condicionales requeridas a partir de una estructura dada.

    En este trabajo se propone el uso de modelos gráficos probabilísticos en el campo de la enseñanza, para realización del diagnóstico de los estudiantes y poder predecir su comportamiento y para analizar datos de tipo docente en general. La educación está sujeta a la supervisión constante de todos los procesos de enseñanza y aprendizaje que la componen.

    Como primera aportación de la tesis (Capítulo 3) se plantea un método basado en clasificación no supervisada para la construcción de una jerarquía de las variables observadas, aplicando un método con clúster jerárquico que supone la existencia de varias variables ocultas. Esta técnica es apropiada cuando existen muchas variables que miden distintos aspectos de un mismo caso y que están fuertemente corraladas entre sí. Este suele ser el caso de muchos conjuntos de datos entre los que están los datos educativos (socio-económicos, aprobación y deserción) de los estudiantes o las encuesta de evaluación del profesorado. La idea básica es similar a la técnica conocida como Autoclass que construye un Naive Bayes en el que la variable clase es una variable oculta no observada, pero en lugar de relacionar todas las variables a través de una única nueva variable, en esta memoria se clasifican todas las variables en una jerarquía y se introduce un nueva variable para cada nodo de la misma. El resultado final será una red bayesiana, que contiene todas las variables observadas que están relacionadas a través de un árbol (o bosque de árboles) de variables ocultas.

    En la memoria comprobamos experimentalmente que nuestro procedimiento produce una muy buena estimación de la distribución de probabilidades conjunta y al mismo tiempo genera un entorno natural y fácil de interpretar. Además como la estructura aprendida está conectada de forma simple (sin ciclos no dirigidos) la inferencia en la misma es muy eficiente.

    Como segunda aportación importante de la tesis se propone un nuevo método de aprendizaje estructural para clasificadores bayesianos (Capítulo 4). Este método aprende redes genéricas usando la metaheurística conocida como optimización basada en mallas variables (VMO) para encontrar el mejor clasificador. La función objetivo a optimizar es la tasa de aciertos (precisión) en el conjunto de datos de aprendizaje mediante validación cruzada. Estamos así ante un método de los conocidos como de envolvente. Para ello tuvimos que adaptar las operaciones de la técnica VMO al problema de la clasificación supervisada. También fueron adaptadas a este problema. En la parte experimental comparamos nuestro método con otros clasificadores del estado del arte, mostrando un comportamiento excepcional.

    Más adelante, en el Capítulo 5, introducimos un nuevo clasificador al que hemos llamado clasificador bayesiano simple (CBS), que aprende de manera rápida una frontera de Markov de la variable clase y una estructura de red que relaciona las variables de la clase y su frontera de Markov. El CBS será una red bayesiana genérica, pero aprendida con una técnica voraz basado en una métrica, que se centra en obtener las variables que de forma conjunta más influyen en la clase. Usa, por tanto, una técnica de filtrado. No hace hipótesis adicionales sobre independencias y sólo supone que la variable clase es un nodo raíz. En la parte experimental se comprueba que su comportamiento en relación a otros clasificadores del estado del arte depende de la métrica usada en la construcción, pero en general producen muy buenos resultados.

    Finalmente, se procede a aplicar las técnicas de clasificación a problemas del ámbito educacional, haciendo énfasis en los datos de deserción estudiantil. La permanencia o deserción de un estudiante en la universidad y la culminación con éxito de sus estudios están influenciadas por diferentes factores: individuales, académicos, socio-económicos e institucionales. El investigar este problema permitirá establecer soluciones que controlen de manera parcial los índices de deserción y que se logre retener a los estudiantes. Aunque este es un problema complejo, se ha logrado conseguir detectar sobre un 32% de los estudiantes que abandonan, con una tasa muy baja de falsos positivos (0,15%).

    Se propone realizar trabajos futuros relacionando mayor cantidad de variables que influyan en la deserción estudiantil como es el caso de la capacitación docente y la infraestructura tecnológica institucional. Al mismo tiempo se considera de gran interés el conseguir más datos, especialmente de aquellos períodos más críticos que determinan el abandono de los estudiantes (primer año de estudios).


Fundación Dialnet

Mi Documat