Ir al contenido

Documat


Resumen de Prospección de datos, aprendizaje computacional y técnicas estadísticas para la obtención de reglas

Inmaculada Fortes Ruiz

  • Este trabajo se enmarca dentro del area de descubrimiento de conocimiento, concretamente en el area de la prospeccion de datos, En los ultimos años, la capacidad de generar y almacenar datos ha crecido de una forma considerable llegando a cantidades enormes. Por lo tanto, surge la necesidad de desarrollar nuevas tecnicas con la capacidad para analizar de manera automatica grandes volumenes de datos y cuyo fin es obtener informacion util y valiosa. Dentro del descubrimiento de conocimiento se encuentra el area de la prospeccion de datos. Este trabajo se centra en las tareas de asociacion, clasificacion y prospeccion en la red.

    En el capitulo 1 hacemos un rapido recorrido por las nociones basicas utilizadas en los siguientes capitulos.

    En el capitulo 2 incluimos como primera aportacion de este trabajo la generalizacion de la busqueda en bases de datos de conjuntos frecuentes con atributos positivos y negativos. En primer lugar, se formaliza el problema introduciendo un lenguaje, una relacion de especializacion y un predicado adecuados.

    A partir de ahí, se introducen las definiciones necesarias para los itemsets con atributos negativos para a continuacion presentar las proposiciones que nos llevaran a los algoritmos que se han desarrollado para obtener todos los conjuntos frecuentes con el menor esfuerzo computacional, es decir, evitado evaluar directamente cada conjunto en la base de datos y calculando su frecuencia a partir de las frecuencias ya calculadas de determinados conjuntos.

    En el capitulo 3 adaptamos los algoritmos de aprendizaje de arboles de decision para considerar las experiencias que tienen valores desconocidos en algun atributo. Definimos un criterio general de division, asignamos valores a los valores desconocidos teniendo en cuenta la informacion dado por los valores del atributo y de la clase y estudiamos la prediccion de observaciones con valores desconocidos. Incluimos resultados experimentales sobre la evaluaci


Fundación Dialnet

Mi Documat