E.I. Caballero Ruiz, María Dolores Cubiles de la Vega , María Teresa Gómez Gómez , Rafael Pino Mejías
Para dos cheros A y B, el enlace de registros intenta identi car pares de registros (a de A, b de B) que se re eren a la misma unidad muestral. Las etapas principales son:
limpieza y estandarizacion de los datos, segmentacion, agrupacion de registros, calculo de comparaciones, y nalmente, a partir de los vectores de comparaciones de pares de registros se debe construir una regla de clasi cacion. Para ello existen dos grandes familias:
tecnicas no supervisadas y tecnicas supervisadas. En este trabajo se presenta una comparaci on de las diversas tecnicas de clasi cacion a partir de bases de datos del Instituto de Estadstica de Andaluca. Se ha empleado el sistema Febrl, un sistema gratuito desarrollado por la Universidad de Australia, sobre el cual se han efectuado algunos ajustes y desarrollos a medida de las necesidades de nuestro trabajo.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados