Ir al contenido

Documat


Algoritmos evolutivos de codificación real para el problema de generación de prototipos en aprendizaje supervisado y semi-supervisado basado en instancias

  • Autores: Isaac Triguero Velázquez Árbol académico
  • Directores de la Tesis: Francisco Herrera Triguero (dir. tes.) Árbol académico, Salvador García López (codir. tes.) Árbol académico
  • Lectura: En la Universidad de Granada ( España ) en 2014
  • Idioma: español
  • Tribunal Calificador de la Tesis: Óscar Cordón García (presid.) Árbol académico, José Manuel Benítez Sánchez (secret.) Árbol académico, Joaquín Derrac Rus (voc.) Árbol académico, Sebastián Ventura Soto (voc.) Árbol académico, Emilio Santiago Corchado Rodríguez (voc.) Árbol académico
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • Resumen El contenido de esta tesis versa sobre el estudio, diseño e implementación de técnicas evolutivas de generación de prototipos en dos campos distintos: (1) clasificación supervisada y (2) clasificación semi-supervisada.

      Los objetivos llevados a cabo fueron:

      1. Estudio del estado del arte de generación de prototipos, estableciendo las fortalezas y debilidades de las técnicas actuales, mediante un análisis teórico y empírico.

      2. Desarrollo de nuevos algoritmos basados en técnicas evolutivas que superen el estado del arte.

      3. La hibridación de estas técnicas con otros esquemas de reducción de datos que mejoren aún más su rendimiento. Concretamente se han desarrollado modelos híbridos con selección de prototipos y ponderación de características.

      4. Habilitar a las técnicas de reducción de datos a ser aplicadas en conjuntos de datos enormes mediante el uso de tecnologías 'cloud'.

      5. Profundizar en el campo de las técnicas de auto-etiquetado para aprendizaje semi-supervisado, proveyendo nuevamente de un estudio del estado del arte que refleje ventajas e inconvenientes de estos métodos.

      6. Aplicar diseñadas para reducción de datos en el ámbito del aprendizaje semi-supervisado con el objetivo de mejorar sus capacidades de clasificación mediante la detección de ruido y la generación de datos sintéticos.

      Con estos objetivos en mente se desarrollaron diferentes técnicas evolutivas de generación de prototipos. La combinación de este proceso con selección de prototipos y esquemas de pesos ha resultado en una herramienta muy útil para mejorar el rendimiento de tareas de clasificación supervisada (enfocados al clasificador del vecino más cercano), en términos de precisión y reducción del tiempo empleado. Además, el modelo distribuido desarrollado para problemas de 'big data' ha sido capaz de abordar problemas con más de 5 millones de ejemplos en un tiempo aceptable sin pérdidas de precisión.

      Desde el punto de vista de la clasificación semi-supervisada, nuestra aportación se ha basado en la incorpación de técnicas, no propias de este ámbito, que han demostrado mejorar el proceso de aprendizaje de las técnicas de auto-etiquetado con la ayuda de datos etiquetados adicionales y la eliminación de datos no etiquetados ruidosos.

      Summary This thesis is devoted to the analysis, design and implementation of evolutionary prototype generation techniques in two different fields: (1) supervised classification and (2) semi-supervised classification.

      The pursued objectives were:

      1. A study of the state-of-the-art of prototype generation models to discover strengths and weaknesses of each family of methods, through a theoretical and empirical analysis.

      2. To develop new algorithms based on evolutionary techniques that overcome the current state-of-the-art.

      3. To hybridizate these techniques with other data reduction approaches that improve even more their performance. Concretely, we have develop hybrid models with prototype selection and feature weighting schemes.

      4. To enable data reduction techniques to be applied in big data sets by using cloud-based technologies.

      5. To perform a deep study self-labeling semi-supervised techniques, providing a new survey of this field that emphasizes the advantages and disadvantages of these models.

      6. To apply data reduction techniques in the field of semi-supervised learning, aiming to improve the classification capabilities by detecting noisy data and generating new synthetic data.

      With these objectives in mind, we developed different evolutionary techniques for prototype generation. The combination of this process with prototype selection and feature weighting has resulted in a very useful tool to improve the performance of supervised classification task (we focused on the nearest neighbor classifier), in terms of accuracy and reduction of runtime spent. Moreover, the distributed model designed to tackle big data problems has been able to address problems with more than 5 million instances in a reasonable runtime without accuracy loss.

      In semi-supervised classification, our contribution is based on the incorporation of techniques, non used in this area, which have shown to enhance the learning process of self-labeling techniques with the aid of additional labeled data and the removal of noisy unlabeled examples.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno