Ir al contenido

Documat


PL4DC: Parameterizable library for data cleaning

  • Gregorio Barchino [1] ; Fernando Gualo [2] ; Ismael Caballero [1] Árbol académico ; Mario Piattini [1] Árbol académico
    1. [1] Universidad de Castilla-La Mancha

      Universidad de Castilla-La Mancha

      Ciudad Real, España

    2. [2] DQTeam, Ciudad Real
  • Localización: Actas de las XXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023) / coord. por Amador Durán Toro Árbol académico, 2023
  • Idioma: inglés
  • Enlaces
  • Resumen
    • La capacidad de recopilar, analizar e interpretar datos ha revolucionado la forma que la sociedad tiene de entender e interactuar con el mundo que nos rodea. Esto ha llevado a que los datos sean la base de todo tipo de decisiones a nivel personal, empresarial, e incluso gubernamental. Para poder tener de-cisiones confiables, la calidad de los datos usados es fundamental. La mejora de calidad de los datos es la parte de la gestión de la calidad de los datos que asegura niveles adecuados de calidad para los datos en un contexto de uso. La limpieza de datos es una tarea fundamental de la mejora de datos. En este artículo se presenta PL4DC, una biblioteca de R desarrollada para implemen-tar operaciones de limpieza de datos basada en ISO/IEC 25024. Estas opera-ciones formarán parte de los parámetros de las primitivas producidas por la investigación desarrollada. Finalmente, se describe cómo se usó PL4DC para el caso concreto de un conjunto de datos de un portal inmobiliario.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno