Uno de los problemas que está presente en una gran variedad de campos, incluyendo reconocimiento de patrones, aprendizaje automático, y estadística, es el problema de la clasificación no supervisada o aprendizaje no supervisado, Dada una base de datos consistente en un conjunto de instancias con una estructura de grupo subyacente, la clasificación no supervisada puede definirse como la descripción de la estructura de grupo subyacente cuando no se desconoce el grupo de pertenencia de cada instancia. La tesis se centra en el estudio de la clasificación no supervisada desde la perspectiva probabilística y, por tanto, no pretende obtener como solución una participación de la base de datos dada sino un modelo del mecanismo generador de los datos, esto es, una distribución de probabilidad conjunta sobre las variables aleatorias del dominio.
Un ejemplo clásico de aproximación probabilística al problema de la clasificación no supervisada son los modelos finitos mixtos. Los cuales, aun reconociendo sus sólidas bases estadísticas, conllevan una serie de dificultades que, en muchos casos, merman su practicidad y atractivo. Dichas dificultades tienen un origen comón: Las manipulaciones y operaciones en espacios altamente multidimensionales que los modelos finitos mixtos conllevan.
La tesis aprovecha las ventajas de los modelos gráficos probabilísticos (principalmente manejabilidad, interpretabilidad, y modularidad), como paradigma que permite codificar distribuciones de probabilidad conjunta a la vez que evita los inconvenientes de los modelos finitos mixtos, con el fin de resolver el problema de la clasificación no supervisada en dominios tanto discretos como continuos. En concreto, la tesis demuestra la utilidad de las redes Bayesianas para clasificación no supervisada en dominios discretos y de las redes condicionales Gaussianas para clasificación no supervisada en dominios continuos, como clases particulares de modelos grá
© 2008-2024 Fundación Dialnet · Todos los derechos reservados