Ir al contenido

Documat


Resumen de Segmentación automática para árboles de decisión: estudio de la estabilidad y la complejidad del algoritmo

Eduard Nafria Mitjans

  • LOS ARBOLES DE CLASIFICACION Y REGRESION (CART) SON UN METODO ESTADISTICO NO PARAMETRICO DE GRAN UTILIDAD EN LAS ACTIVIDADES DE TOMA DE DECISIONES, SE TRATA DE DETERMINAR DE FORMA AUTOMATICA CUALES SON LAS VARIABLES EXPLICATIVAS MAS SIGNIFICATIVAS RESPECTO A UNA VARIABLE DE RESPUESTA.

    LA PRINCIPAL VENTAJA Y NOVEDAD DEL METODO ES LA CLARIDAD DE RESULTADOS Y GENERACION AUTOMATICA DE REGLAS DE DECISION.

    LA TESIS SE DIVIDE EN 3 BLOQUES:

    A) DISEÑO E IMPLEMENTACION DE UN ALGORITMO QUE FUNCIONA BAJO WINDOWS, DE COSTE LINEAL RESPECTO EL NUMERO DE INDIVIDUOS, NUMERO DE VARIABLES Y PROFUNDIDAD; CAPAZ DE TRABAJAR CON GRANDES CONJUNTOS DE DATOS (50.000 INDIVIDUOS I 50 VARIABLES).

    B) ANALISIS DE LA ESTABILIDAD DEL METODO, MEDIANTE UNA FORMULACION GENERAL DEL INDICE DE IMPUREZA, CAPAZ DE DETECTAR LAS CONTRIBUCIONES INDIVIDUALES A LA REDUCCION DE IMPUREZA. TAMBIEN SE PROPONE UN NUEVO INDICE ESTABLE Y ROBUSTO, PARA EL CASO DE CLASIFICACION.

    C) ESTUDIO COMPARATIVO DE LOS DISTINTOS METODOS ALTERNATIVOS (REGRESION LOGISTICA, REDES NEURONALES Y ANALISIS DISCRIMINANTE), PARA DOS PROBLEMAS REALES, FRENTE A LOS ARBOLES DE CLASIFICACION.


Fundación Dialnet

Mi Documat