Ir al contenido

Documat


Nuevos algoritmos de clasificación de documentos científicos individuales basados en referencias para mejorar los análisis cienciométricos en las grandes bases de datos de ciencia

  • Autores: Jesús María Álvarez Llorente
  • Directores de la Tesis: Vicente Pablo Guerrero Bote (dir. tes.) Árbol académico, Miguel Angel Pérez Toledano (codir. tes.) Árbol académico
  • Lectura: En la Universidad de Extremadura ( España ) en 2025
  • Idioma: español
  • Tribunal Calificador de la Tesis: Benjamín Vargas Quesada (presid.) Árbol académico, José Manuel Chaves González (secret.) Árbol académico, Rodrigo Sánchez-Jiménez (voc.) Árbol académico
  • Enlaces
  • Resumen
    • español

      Este trabajo describe el proceso de creación y validación del algoritmo de clasificación de publicaciones científicas individuales denominado U1-F-0.8, aplicable a las grandes bases de datos científicas como Web of Science o Scopus, que mejora, sin grandes disrupciones, la precisión de la clasificación por revistas utilizada en ellas.

      Se trata de un sistema de clasificación basado en referencias, a las que se le aplica un proceso de preclasificación según las publicaciones que las citan, lo que proporciona una semántica innovadora y permite aprovechar todas las referencias. Además, incorpora procedimientos de normalización para amortiguar las diferencias en los hábitos de citación entre disciplinas. Utiliza el esquema de clasificación denominado ASJC fraccionario (All Science Journal Classification de Scopus, sin área multidisciplinar ni categorías misceláneas), en el que los documentos son asignados de manera ponderada a un máximo de 5 categorías evitando asignaciones débiles.

      Como pasos previos al desarrollo del algoritmo propuesto, en primer lugar se creó la AAC (Author's Assignation Collection), un extenso corpus de publicaciones clasificadas por sus autores de correspondencia con el objetivo de contar con una herramienta de comparación. En un segundo paso se desarrolló el algoritmo M3-AWC-0.8, un sistema de clasificación de publicaciones individuales basado en referencias de dos generaciones en el que se experimentó con parámetros de normalización de citas y optimización de asignaciones múltiples, y que sirve, además, como una segunda herramienta de comparación.

      Conclusiones Se ha desarrollado y validado el algoritmo de clasificación U1-F-0.8, un sistema de clasificación de documentos individuales computacionalmente escalable y aplicable al conjunto de la ciencia con un número ínfimo de excepciones, sin componentes aleatorios, que respeta las diferencias entre disciplinas, basado en un esquema de clasificación aceptado por la comunidad científica, con posibilidad de asignaciones múltiples y que mejora sin grandes disrupciones la clasificación por revistas.

      Adicionalmente se aportan al campo de investigación dos herramientas muy valiosas, la clasificación M3-AWC-0.8 y la colección AAC.

    • English

      This paper describes the process of creation and validation of the individual scientific publication classification algorithm named U1-F-0.8, applicable to large scientific databases such as Web of Science or Scopus, which improves, without major disruptions, the accuracy of journal classification used therein.

      It is a classification system based on references, to which a pre-classification process is applied according to the publications that cite them, providing innovative semantics and allowing the utilization of all references. Additionally, it incorporates normalization procedures to mitigate differences in citation habits between disciplines. It uses the fractional ASJC classification scheme (All Science Journal Classification of Scopus, excluding the Multidisciplinary area and miscellaneous categories), in which documents are weightily assigned to a maximum of 5 categories, avoiding weak assignments.

      As preliminary steps to the development of the proposed algorithm, firstly, the AAC (Author’s Assignation Collection) was created, an extensive corpus of publications classified by their corresponding authors with the aim of having a comparison tool. In a second step, the M3-AWC-0.8 algorithm was developed, a classification system for individual publications based on two-generation references, in which citation normalization parameters and multiple assignment optimization were experimented with, constituting, in addition, a second comparison tool.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno