Ir al contenido

Documat


Resumen de Data Warehouses: Traceability and Alignment with Corporate Strategies

Alejandro Maté Morga Árbol académico

  • Introducción En la actualidad los proyectos de almacenes de datos presentan un ratio de fracaso de más del 70%, y sufren una serie de problemas que no pueden ser solucionados mediante las técnicas de desarrollo actuales. En primer lugar, las aproximaciones actuales no proveen ningún mecanismo para preservar la trazabilidad. Por tanto, conforme los esquemas multidimensionales creados conforme a los requisitos son modificados de acuerdo a los datos disponibles, la capacidad de identificar el estado de cada requisito en el desarrollo se pierde. En segundo lugar, las aproximaciones actuales se centran principalmente en diseñar el repositorio del almacén de datos. Sin embargo, los almacenes de datos son proyectos a largo plazo, que requieren un soporte adecuado para el mantenimiento y la introducción de cambios conforme el negocio cambia. En tercer lugar, los almacenes de datos son utilizados por varios tomadores de decisión, expertos en distintas áreas del negocio y rara vez expertos en tecnología. Así pues, es necesario un proceso de validación para asegurar que los requisitos han sido correctamente elicitados y que el almacén de datos soporta los objetivos del negocio que se quieren mejorar.

    Desarrollo teórico En esta tesis doctoral se abordan los problemas anteriormente descritos mediante (i) la introducción de una aproximación para el mantenimiento de la trazabilidad a lo largo del proceso de desarrollo del almacén de datos, (ii) la formalización del proceso de reconciliación, dotando al diseñador de las herramientas necesarias para documentar el proceso y facilitando la integración de nuevos orígenes de datos de forma más sencilla, (iii) la introducción de módulos para el particionado de diagramas de requisitos, mejorando la comunicación entre los desarrolladores y los usuarios, y (iv) un proceso de alineamiento para asegurar que el almacén de datos soporta los objetivos actuales del negocio.

    Para el mantenimiento de la trazabilidad se elabora un modelo semántico de trazabilidad junto a una serie de transformaciones automáticas basadas en el estándar Query/View/Transformation del Object Management Group. De esta forma, conforme se crean los modelos del almacén de datos estos modelos son, a su vez, trazados y los requisitos se mantienen actualizados en todo momento.

    Para la formalización del proceso de reconciliación se lleva a cabo un análisis de las relaciones existentes entre requisitos y fuentes de datos desde el punto de vista de la Teoría de Conjuntos. A partir de este análisis se elaboran una serie de relaciones semánticas que son capaces de capturar la relación exacta entre los requisitos y los distintos elementos incluidos en las fuentes de datos, de manera que el diseñador puede documentar de manera precisa el proceso de reconciliación del almacén.

    En el caso de los diagramas de requisitos se realiza un estudio de las características de los modelos orientados a objetivos que se usan como estado del arte para la elicitación de requisitos en almacenes de datos. A continuación, se realiza una propuesta de modularización de estos diagramas y se lleva a cabo un experimento para evaluar el impacto de la modularización en el proceso de elicitación y modelado de requisitos.

    Finalmente, se propone un método para comprobar el alineamiento del almacén de datos con los objetivos del negocio, mediante el modelado de la estrategia del negocio y el alineamiento entre los objetivos que debe soportar el almacén y la estrategia.

    Conclusiones En esta tesis doctoral se han analizado las dificultades actuales en el desarrollo de almacenes de datos y se han presentado las bases para un enfoque de desarrollo de almacenes de datos mejorado que supera estos problemas. Además de presentar las distintas propuestas a lo largo de la tesis, se han integrado estas propuestas en una aproximación para el desarrollo de almacenes de datos utilizando una aproximación basada en el desarrollo dirigido por modelos como base. Finalmente, cabe destacar que las propuestas realizadas en esta tesis doctoral pueden ser combinadas con la mayoría de aproximaciones de desarrollo de almacenes de datos existentes, permitiendo así flexibilidad en la elección del conjunto los modelos utilizados.

    Así pues, los resultados obtenidos en esta tesis doctoral son:

    - La preservación de la trazabilidad en el desarrollo del almacén de datos.

    - La formalización y documentación del proceso de reconciliación.

    - Mejora del mantenimiento del almacén de datos y sus modelos asociados.

    - Mejora de la comunicación con los usuarios por medio de diagramas particionados.

    - El alineamiento de los requisitos de los usuarios y el almacén de datos con el plan del negocio.

    Además, los resultados obtenidos en la tesis doctoral abren la posibilidad a nuevas vías de investigación, entre las cuales se destacan (i) el desarrollo una aproximación de identificación automática de correspondencias, con el fin de ayudar al diseñador en la adecuación de las fuentes de datos, (ii) la aplicación de técnicas de modelado estratégico para el análisis y la interpretación de datos, (iii) la creación de algoritmos de análisis de calidad y coste sobre modelos de requisitos del almacén y sobre modelos de fuentes de datos, y (iv) la identificación y análisis de la toma de decisiones de forma colaborativa para alcanzar los objetivos del negocio establecidos.


Fundación Dialnet

Mi Documat