Ir al contenido

Documat


¿De qué temas hablamos en JENUI?: Modelado de topics con Latent Dirichlet Allocation (LDA)

  • Autores: Raúl Marticorena Sánchez Árbol académico, Carlos López Nozal Árbol académico, José Miguel Ramírez Sanz, José Luis Garrido Labrador
  • Localización: Actas de las Jornadas sobre la Enseñanza Universitaria de la Informática (JENUI), ISSN 2531-0607, Nº. 9 (Actas de las XXX Jornadas sobre Enseñanza Universitaria de la Informática (La Coruña, 19, 20 y 21 de), 2024, págs. 133-140
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      Las Jornadas en Enseñanza Universitaria en Informática (JENUI) se han venido desarrollando a lo largo de tres décadas, desde el año 1994 a la actualidad. En dicho periodo, la temática abordada ha evolucionado, cambiando el ámbito y tema de los trabajos, en función del progreso de la informática y su enseñanza en el ámbito universitario. La técnica de aprendizaje no supervisado sobre texto, denominada modelo de temas (topic model), mejora la comprensión de grandes cantidades de datos textuales agrupando los documentos en temas. El presente trabajo aplica esta técnica procesando las actas completas de JENUI con sus 1745 documentos. Partiendo de la extracción del texto de títulos y resúmenes, se aplica el algoritmo de Latent Dirichlet Allocation (LDA), estimando el número óptimo de temas. El trabajo construye un clasificador temático con los artículos de JENUI. Además, analiza la distribución de temas y las probabilidades de los términos de cada tema junto con la evolución temática de los trabajos a largo del tiempo. Desde una perspectiva más objetiva y científica, se concluye que existe una evolución temática, a lo largo de las 27 ediciones con actas de JENUI.

    • English

      The JENUI (Jornadas en Enseñanza Universitaria en Informática) have been held for three decades, from 1994 to the present day. During this period, the subject matter has evolved, changing the scope and topic of the papers, depending on the progress of computer science and its teaching at university level. The unsupervised text-based learning technique, known as the topic model, improves the understanding of large amounts of textual data by grouping documents into topics. This paper applies this technique by processing the complete proceedings of JENUI with its 1745 documents. Starting from the extraction of text from titles and abstracts, the Latent Dirichlet Allocation (LDA) algorithm is applied, estimating the optimal number of topics. The work constructs a topic classifier with the JENUI articles. In addition, it analyses the distribution of topics and the probabilities of the terms of each topic together with the topic evolution of the papers over time. From a more objective and scientific perspective, it is concluded that there is a thematic evolution over the 27 editions with JENUI proceedings.

  • Referencias bibliográficas
    • [1] Ricardo Alberich y Joe Miró. La colaboración en el JENUI revisited: la convergencia europea. En Actas de las XV Jornadas de Enseñanza...
    • [2] David M. Blei, Andrew Y. Ng, y Michael I. Jordan. Latent Dirichlet Allocation. J. Mach. Learn. Res., 3:993–1022, 2003.
    • [3] Agustín Cernuda del Río. La recuperación y edición integral de las actas de JENUI. En Actas de las XXVIII Jornadas de Enseñanza Universitaria...
    • [4] Sang-Woon Kim y Joon-Min Gil. Research paper classification systems based on TF-IDF and LDA schemes. Human-Centric Computing and Information...
    • [5] Zhongju Liao y Xiaodie Liu. Trending topics and themes in environmental innovation research based on topic modeling. Sustainable Development,...
    • [6] Joe Miró y Ricardo Alberich. La colaboración en el Jenui, a quién nos parecemos y a quién no. En Actas de las X Jornadas de Enseñanza...
    • [7] Joe Miró y David López. Un análisis bibliométrico de las JENUI. En Actas de las XVIII Jornadas de Enseñanza Universitaria de la Informática,...
    • [8] Louis Owen. Hyperparameter Tuning with Python: Boost your machine learning model’s performance via hyperparameter tuning. Packt Publishing,...
    • [9] Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, y Harshit Surana. Practical Natural Language Processing: A Comprehensive Guide to Building...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno