Desde su introducción en los años ochenta por Z. Pawlak, la teoría de conjuntos rugosos (RST, de sus siglas en inglés, Rough Set Theory) ha sido ampliamente estudiada. Esta teoría conforma una herramienta matemática que permite analizar conjuntos de datos relacionales que contienen información imprecisa o incompleta. En este marco de trabajo, los conjuntos de datos se interpretan como tablas de información, constituidas por un conjunto de objetos y un conjunto de atributos que definen a los primeros.
Esta tesis doctoral se enmarca en dos líneas de investigación importantes en RST: la reducción o selección de atributos y la clasificación de nuevos objetos. Aunque ambas líneas se pueden desarrollar de manera independiente, a lo largo de este trabajo, se mostrará que están estrechamente relacionadas.
En primer lugar, se muestra un estudio pormenorizado de la relación entre los reductos y reductos valor con los birreductos en RST. Una de las grandes ventajas que proporciona este entorno es la reducción del tamaño de los conjuntos de datos mediante la eliminación de información irrelevante, tanto en el conjunto de atributos, considerando reductos y reductos valor, como en ambos conjuntos, el de atributos y el de objetos, usando birreductos. Sin embargo, en la literatura no se ha estudiado la relación entre ambos mecanismos de reducción. En el presente trabajo se muestra la posibilidad de obtener reductos y reductos valor a partir de birreductos, y viceversa, tanto en sistemas de información como de decisión, así como con los tres tipos de birreductos que existen. Esta relación simplifica el cálculo de los conjuntos de objetos y atributos en ambos ambientes y proporciona un mayor conocimiento de los birreductos. Además, permite conocer mejor las características de los reductos valor, que no han sido estudiados con tanto detalle como los reductos y birreductos.
A continuación, se ha llevado a cabo la extensión formal de distintas nociones de RST, fundamentales para el modelado de bases de datos con información imperfecta, lo cual posibilitará en un siguiente proceso la clasificación de nuevos objetos en este tipo de bases de datos. Este hecho es especialmente relevante para el estudio de conjuntos de datos reales, debido a la inconsistencia e imprecisión presente en ellos. En RST, estos estudios se apoyan en la noción de algoritmo de decisión, que está formado por un conjunto de reglas de decisión satisfaciendo una serie de propiedades para representar adecuadamente la información presente en la base de datos y realizar deducciones. Sin embargo, a pesar de la relevancia de esta noción para el análisis de datos, los estudios correspondientes tienen grandes limitaciones debido a la rigidez del entorno clásico. Los estudios anteriores se han trasladado al marco de trabajo proporcionado por la teoría de conjuntos rugosos difusos (FRST, de sus siglas en inglés, Fuzzy Rough Set Theory). Este entorno constituye un escenario ideal para realizar dicha tarea debido a la flexibilidad propia de la filosofía difusa. En particular, se recoge la generalización de numerosas nociones de RST relativas a las reglas de decisión al marco de FRST, como la de soporte, fuerza, certeza, etc., y destacando especialmente la introducción de los algoritmos de decisión difusos. Este hecho es fundamental para abordar el estudio de conjuntos de datos con información imperfecta y con inconsistencias.
Finalmente, el uso de las reglas de decisión en el entorno de FRST facilita considerablemente la clasificación de datos nuevos. Este es un tema de gran interés en la actualidad debido a su relación con el diseño de sistemas inteligentes, así como por su impacto en numerosos ámbitos, como el social, clínico o financiero. El estudio previo es fundamental para proporcionar nuevas definiciones, propiedades y mecanismos matemáticos para la toma de decisiones. En particular, se incluyen cuatro métodos de clasificación de nuevos objetos. Cada uno de ellos aborda la problemática de la toma de decisiones desde un punto de vista diferente, permitiendo aplicarlos simultáneamente para obtener una clasificación más sólida. Este hecho, sumado a las ventajas derivadas del uso del marco de FRST, confiere al usuario de una gran libertad para afrontar cualquier problema de clasificación con una base de datos de partida con información imperfecta.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados