Ir al contenido

Documat


Resumen de Optimization-based methods for classification and regression problems with imprecise data

José F. Gordillo Santofimia

  • español

    En esta tesis, desarrollamos varias herramientas para resolver problemas de clasificación y regresión donde los elementos del conjunto de datos no son vectores de características puntuales, sino conjuntos en Rd con ciertas propiedades geométricas. El clasificador o regresor se define siguiendo la estrategia, utilizada con éxito en Máquinas de Vectores Soporte, de maximizar el margen. En cada caso, se formula un problema de optimización, que hay que resolver para encontrar el clasificador o regresor óptimo. Se obtienen varios tipos de problemas de optimización para estos problemas: programas convexos cuadráticos cuando buscamos hiperplanos para tareas de clasificación o regresión (cuya solución se obtendría directamente usando un solucionador, como CPLEX o LOQO [112]) o programas no lineales y no lineales enteros mixtos cuando buscamos hiperesferas separadoras (donde desarrollaremos algoritmos exactos o heurísticos para obtener una solución óptima). El problema se formula como un modelo de maximización de margen. Se estudian las condiciones necesarias de optimalidad y se obtiene un conjunto dominante finito de soluciones, que conduce a un algoritmo en tiempo polinomial. Se han realizado experimentos computacionales con conjuntos de datos de referencia y artificiales para cada modelo, obteniendo buenos resultados, lo que muestra que las herramientas desarrolladas son competitivas.

  • English

    In this thesis, we develop several tools to solve classification and regression problems where the elements of the database are sets affected by some kind of uncertainty several particular cases are studied via this methodology, interval data, Perturbed data and bags of instances.

    The classifier and regressor is defined by following the strategy successfully used in support vector machines of maximizing the margin in each case, an optimization problem is formulated which must be solved to obtain an optimal classifier or regressor.

    These techniques are shown to be useful for imputation based on intervals and for a semi-obnoxious location problem (in the framework of locational analysis).


Fundación Dialnet

Mi Documat