Ir al contenido

Documat


Estrategias de recuperación de información mediante " pooling " para la construcción de colecciones de referencia desde redes sociales: caso de estudio durante las tensiones raciales de 2020

  • Patricia Martín-Rodilla [1] Árbol académico ; David Otero [1]
    1. [1] Universidade da Coruña

      Universidade da Coruña

      A Coruña, España

  • Localización: Scire vias: humanidades digitales y conocimiento / coord. por Fátima Díez Platas Árbol académico, César González Pérez Árbol académico, 2023, ISBN 9788497498746, págs. 347-365
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      Las redes sociales son una valiosa fuente de información para documentar los procesos de surgimiento o evolución en patrimonio cultural, también para obtener una instantánea en tiempo real de un tema de investigación dentro del mismo. Muchos investigadores en este campo emplean las redes sociales para estudiar estos procesos, creando, para ello, colecciones que constituyen archivos digitales, potencialmente reutilizables y de interés para otros investigadores. Sin embargo, las técnicas de recuperación y de archivo empleadas actualmente con este objetivo requieren mucho tiempo y esfuerzo, dificultando la reproducibilidad, la evaluación y la liberación de las colecciones. Combinando ideas de Recuperación de Información con técnicas emergentes utilizadas en el campo del archivo, podemos mejorar este proceso y reducir el esfuerzo requerido para construir colecciones nuevas. Concretamente, el pooling es una técnica ampliamente empleada en el campo de la Recuperación de Información para extraer una muestra de documentos (publicaciones en el caso de las redes sociales) de un conjunto más grande, de tal manera que sea una muestra completa e imparcial de documentos relevantes sobre un tema determinado. Esto es especialmente útil en el caso de las redes sociales, debido a la enorme cantidad de publicaciones que se crean en estas cada día. Con este método podemos crear una colección de referencia evitando anotar todo el corpus de documentos. En este artículo presentamos la aplicación de esta metodología para la creación de colecciones de referencia a partir del contenido de una red social. Mostramos como, con el método presentado, podemos crear nuevas colecciones reduciendo drásticamente el número de documentos anotados con respecto al tamaño del corpus entero y, por tanto, reducir el esfuerzo y el tiempo requeridos. Finalmente, validamos la metodología presentada mediante la creación de una colección de referencia sobre los ataques sobre el patrimonio que ocurrieron durante 2020 motivados por protestas antirracistas.

    • English

      Social networks are a valuable source of information for documenting the processes of emergence or evolution in cultural heritage and obtaining a real-time snapshot of a research topic within it. Many researchers in this field use social networks to study these processes, creating collections that constitute digital archives, potentially reusable and of interest to other researchers. However, the retrieval and archiving techniques currently employed for this purpose are time and effort-consuming, making reproducibility, evaluation and release of the collections difficult.

      Combining ideas from Information Retrieval with emerging techniques used in the archival field can improve this process and reduce the effort required to build new collections. Specifically, pooling is a technique widely used in the Information Retrieval field to extract a sample of documents (publications in the case of social networks) from a larger set, such that it is a complete and unbiased sample of relevant documents on a given topic.

      This is especially useful in the case of social networks due to the enormous number of posts created on social networks every day. With this method, we can create a reference collection avoiding annotating the entire corpus of documents. In this article, apply this methodology for the creation of reference collections from the content of a social network. We show how, with the presented method, we can create new collections by drastically reducing the number of annotated documents with respect to the size of the entire corpus and, therefore, reducing the effort and time required. Finally, we validate the presented methodology by creating a reference collection on heritage attacks that occurred in 2020 motivated by anti-racist protests.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno