Ir al contenido

Documat


Resumen de ¿De qué temas hablamos en JENUI?: Modelado de topics con Latent Dirichlet Allocation (LDA)

Raúl Marticorena Sánchez Árbol académico, Carlos López Nozal Árbol académico, José Miguel Ramírez Sanz, José Luis Garrido Labrador

  • español

    Las Jornadas en Enseñanza Universitaria en Informática (JENUI) se han venido desarrollando a lo largo de tres décadas, desde el año 1994 a la actualidad. En dicho periodo, la temática abordada ha evolucionado, cambiando el ámbito y tema de los trabajos, en función del progreso de la informática y su enseñanza en el ámbito universitario. La técnica de aprendizaje no supervisado sobre texto, denominada modelo de temas (topic model), mejora la comprensión de grandes cantidades de datos textuales agrupando los documentos en temas. El presente trabajo aplica esta técnica procesando las actas completas de JENUI con sus 1745 documentos. Partiendo de la extracción del texto de títulos y resúmenes, se aplica el algoritmo de Latent Dirichlet Allocation (LDA), estimando el número óptimo de temas. El trabajo construye un clasificador temático con los artículos de JENUI. Además, analiza la distribución de temas y las probabilidades de los términos de cada tema junto con la evolución temática de los trabajos a largo del tiempo. Desde una perspectiva más objetiva y científica, se concluye que existe una evolución temática, a lo largo de las 27 ediciones con actas de JENUI.

  • English

    The JENUI (Jornadas en Enseñanza Universitaria en Informática) have been held for three decades, from 1994 to the present day. During this period, the subject matter has evolved, changing the scope and topic of the papers, depending on the progress of computer science and its teaching at university level. The unsupervised text-based learning technique, known as the topic model, improves the understanding of large amounts of textual data by grouping documents into topics. This paper applies this technique by processing the complete proceedings of JENUI with its 1745 documents. Starting from the extraction of text from titles and abstracts, the Latent Dirichlet Allocation (LDA) algorithm is applied, estimating the optimal number of topics. The work constructs a topic classifier with the JENUI articles. In addition, it analyses the distribution of topics and the probabilities of the terms of each topic together with the topic evolution of the papers over time. From a more objective and scientific perspective, it is concluded that there is a thematic evolution over the 27 editions with JENUI proceedings.


Fundación Dialnet

Mi Documat