Reducción de datos basada en selección evolutiva de instancias para minería de datos

José Ramón Cano de Amo

Ayuda

Reducción de datos basada en selección evolutiva de instancias para minería de datos

Autores: José Ramón Cano de Amo
Directores de la Tesis: Manuel Lozano Márquez (dir. tes.) , Francisco Herrera Triguero (dir. tes.)
Lectura: En la Universidad de Granada ( España ) en 2004
Idioma: español
Tribunal Calificador de la Tesis: Josep Maria Garrell i Guiu (presid.) , Juan Carlos Cubero Talavera (secret.) , Pedro Larrañaga Múgica (voc.) , José Cristobal Riquelme Santos (voc.) , José Hernández Orallo (voc.)
Texto completo no disponible (Saber más ...)
Resumen
- El objeto de estudio de esta tesis es analizar la selección de instancias mediante algoritmos evolutivos para preprocesar un conjunto de datos teniendo como finalidad la reducción de datos, La reducción a través de la selección de instancias tiene como objetivos el clasificar con el vecino más cercano y la extracción de modelos descriptivos y predictivos a partir de los subconjuntos seleccionados.
  
  La tesis se estructura de la siguiente forma. En el primer capítulo se estudia el proceso de descubrimiento de información en bases de datos.
  
  Se dirige la atención a la etapa de preprocesamiento, y dentro de ésta en la reducción de datos y selección de instancias. Se estudia así mismo el empleo de algoritmos evolutivos en la extracción de conocimiento en la literatura. El segundo capítulo analiza diferentes técnicas de selección de instancias evolutivas y no evolutivas en conjuntos de tamaño pequeño, para clasificar con el vecino más cercano y para extraer modelos predictivos.
  
  De entre los algoritmos analizados, el algoritmo evolutivo CHC se destaca frente al resto. En el capítulo 3 se analiza la selección de instancias en conjuntos de tamaño grande, con el problema de escalado que supone.
  
  Para solventarlo, se propone la combinación de selección evolutiva y estratificación para clasificar con el vecino más cercano, ofreciéndose los mejores resultados.
  
  El último capítulo analiza la combinación sugerida en el capítulo anterior desde la perspectiva de la extracción de modelos predictivos y descriptivos para el descubrimiento de subgrupos. Dicha combinación proporciona los modelos con mayores índices de precisión e interpretabilidad y aquellos compuestos por reglas más novedosas, atípicas, etc.