En esta memoria se presenta un método que permite construir modelos de clasificación simples, inteligibles y robustos de una forma eficiente y escalable, El objetivo final de la tesis es logar un algoritmo eficiente computacionalmente que sea capaz de trabajar con grandes conjuntos de datos, a semejanza de los modernos algoritmos de construcción de árboles de decisión.
Las cualidades anteriores se han de conseguir sin olvidar la necesidad de construir clasificadores que destaquen por su simplicidad, tal como los obtenidos mediante algoritmos de inducción de reglas y listas de decisión.
Por otro lado, el método propuesto ha de ser robusto; es decir, debe ser capaz de funcionar correctamente ante la presencia de ruido en el conjunto de entrenamiento que se utilice para construir el clasificador.
Para cumplir los objetivos identificados en el párrafo anterior, en esta memoria se presenta un método de construcción de modelos de clasificación que combina las mejores cualidades de los árboles de decisión con las de las técnicas de inducción de reglas. El método propuesto da lugar una nueva familia de algoritmos de inducción de árboles de decisión basada en técnicas de extracción de reglas de asociación (19), si bien también puede interpretarse como un algoritmo de inducción de listas de decisión. El uso de técnicas de extracción de reglas de asociación para construir un árbol de decisión da nombre al método propuesto en esta memoria: ART, acrónimo de Association Rule Trees.
El modelo de clasificación ART se caracteriza por dotar de mayor flexibilidad a las técnicas tradicionales de construcción de árboles de decisión, al permitir la utilización simultánea de varios atributos para ramificar el árbol de decisión y agrupar en una rama "else" las ramas de árbol menos interesantes a la hora de clasificar datos, sin descuidar por ello cuestiones relativas a la eficiencia del proceso de aprendizaje. Para lo
© 2008-2024 Fundación Dialnet · Todos los derechos reservados