Ir al contenido

Documat


Record Linkage with RELAIS: Experiences and Challenges

  • Autores: Nicoletta Cibella, Monica Scannapieco, Laura Tosco, Tiziana Tuoto, Luca Valentino
  • Localización: Estadística española, ISSN 0014-1151, Vol. 54, Nº 179, 2012, págs. 311-328
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      El uso combinado de datos provenientes de distintas fuentes se ha generalizado en gran medida para maximizar su respectiva utilidad: lamentablemente sucede que a menudo las distintas fuentes de información son difíciles de integrar debido a errores o a la falta de información. Las técnicas de enlace de registros son un conjunto multidisciplinario de métodos y prácticas que pretenden identificar la misma entidad del mundo real, diferentemente representada en las distintas fuentes de datos. El enlace de registros es un proceso complejo que puede descomponerse en fases separadas, en la que cada una de ellas requiere de una técnica específica. En este artículo se describe RELAIS (Record Linkage At IStat), un conjunto de herramientas de código abierto basado en la idea de seleccionar la técnica más adecuada para cada fase y combinarlas dinámicamente para construir el flujo de trabajo del enlace de registros. El código abierto resultó ser una opción acertada para compatir técnicas y software y contribuye fuertemente a hacer valer RELAIS entre los Institutos Nacionales de Estadística.

      En el artículo se muestra la utilidad y los beneficios de RELAIS a la hora de enfrentar determinados desafíos en el enlace de microdatos, alcanzando un alto nivel de calidad en el proceso de enlace y en los resultados asociados.

    • English

      The combined use of data coming from different sources is largely widespread to maximize their respective usefulness: unfortunately data sources are often hard to integrate due to errors or lacking information. Record linkage techniques are a multidisciplinary set of methods and practices aiming to identify the same real world entity, differently represented in data sources. Record linkage is a complex process but it can be decomposed in separate phases, each of them requiring a specific technique. In this paper we describe RELAIS (REcord Linkage At IStat), an open source toolkit based on the idea of choosing the most appropriate technique for each phase and of dynamically combining them so as to build a record linkage workflow. The open source turned out to be a winning choice for sharing techniques and software and it strongly contributed to assert RELAIS in the National Statistical Institutes� community. In the paper we show the usefulness and the profitability of RELAIS in facing several challenges in linking data at micro-level, achieving a high quality of the linkage process and of the related results.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno