Ir al contenido

Documat


Resumen de Nuevos algoritmos de clasificación de documentos científicos individuales basados en referencias para mejorar los análisis cienciométricos en las grandes bases de datos de ciencia

Jesús María Álvarez Llorente

  • Introducción Este trabajo describe el proceso de creación y validación del algoritmo de clasificación de publicaciones científicas individuales denominado U1-F-0.8, aplicable a las grandes bases de datos científicas como Web of Science o Scopus, que mejora, sin grandes disrupciones, la precisión de la clasificación por revistas utilizada en ellas.

    Desarrollo Se trata de un sistema de clasificación basado en referencias, a las que se le aplica un proceso de preclasificación según las publicaciones que las citan, lo que proporciona una semántica innovadora y permite aprovechar todas las referencias. Además, incorpora procedimientos de normalización para amortiguar las diferencias en los hábitos de citación entre disciplinas. Utiliza el esquema de clasificación denominado ASJC fraccionario (All Science Journal Classification de Scopus, sin área multidisciplinar ni categorías misceláneas), en el que los documentos son asignados de manera ponderada a un máximo de 5 categorías evitando asignaciones débiles.

    Como pasos previos al desarrollo del algoritmo propuesto, en primer lugar se creó la AAC (Author's Assignation Collection), un extenso corpus de publicaciones clasificadas por sus autores de correspondencia con el objetivo de contar con una herramienta de comparación. En un segundo paso se desarrolló el algoritmo M3-AWC-0.8, un sistema de clasificación de publicaciones individuales basado en referencias de dos generaciones en el que se experimentó con parámetros de normalización de citas y optimización de asignaciones múltiples, y que sirve, además, como una segunda herramienta de comparación.

    Conclusiones Se ha desarrollado y validado el algoritmo de clasificación U1-F-0.8, un sistema de clasificación de documentos individuales computacionalmente escalable y aplicable al conjunto de la ciencia con un número ínfimo de excepciones, sin componentes aleatorios, que respeta las diferencias entre disciplinas, basado en un esquema de clasificación aceptado por la comunidad científica, con posibilidad de asignaciones múltiples y que mejora sin grandes disrupciones la clasificación por revistas.

    Adicionalmente se aportan al campo de investigación dos herramientas muy valiosas, la clasificación M3-AWC-0.8 y la colección AAC.

    Bibliografía más representativa Álvarez-Llorente, J. M., Guerrero Bote, V. P., & De Moya-Anegón, F. (2023). Creating a collection of publications categorized by their research guarantors into the Scopus ASJC scheme. Profesional de la Información, 32(7), Article e320704. https://doi.org/10.3145/epi.2023.dic.04 Álvarez-Llorente, J. M., Guerrero-Bote, V. P., & De Moya-Anegón, F. (2024). New fractional classifications of papers based on two generations of references and on the ASJC Scopus scheme. Scientometrics, 129(6), 3493-3515. https://doi.org/10.1007/s11192-024-05030-2 Álvarez-Llorente, J. M., Guerrero-Bote, V. P., & De Moya-Anegón, F. (2025). New paper-by-paper classification for Scopus based on references reclassified by the origin of the papers citing them. Journal of Informetrics, 19(2), 101647. https://doi.org/10.1016/j.joi.2025.101647 Glänzel, W., Thijs, B., & Huang, Y. (2021). Improving the precision of subject assignment for disparity measurement in studies of interdisciplinary research. In: W. Glänzel, S. Heeffer, PS. Chi, R. Rousseau, Proceedings of the 18th International Conference of the International Society of Scientometrics and Informetrics (ISSI 2021), Leuven University Press, 453-464. https://kuleuven.limo.libis.be/discovery/fulldisplay/docid=lirias3394551&context=SearchWebhook&vid=32KUL_KUL:Lirias&search_scope=lirias_profile&tab=LIRIAS&adaptor=SearchWebhook&lang=en


Fundación Dialnet

Mi Documat