Ir al contenido

Documat


Resumen de Automated Evolution of Data Schemas in Variability-Intensive Information Systems

María Delfina Ramos Vidal

  • español

    Las organizaciones actuales dependen cada vez más de sistemas de información intensivos en datos para dar soporte a sus procesos de negocio. Estos sistemas, diseñados con una alta variabilidad para satisfacer las diversas necesidades de los clientes, evolucionan continuamente para adaptarse a cambios en requisitos, normativas y tecnologías. Con el tiempo, la complejidad acumulada, las tecnologías obsoletas y las inconsistencias pueden volverlos ineficaces, haciendo necesaria su reingeniería. Los enfoques tradicionales de reingeniería, especialmente en el caso de múltiples sistemas heredados similares, suelen ser costosos y gestionarse de forma ad-hoc. La ingeniería de Líneas de Productos Software (LPS) ofrece una solución para la reingeniería de familias de sistemas relacionados, fomentando la gestión sistemática de la variabilidad y la reutilización de componentes. Sin embargo, los enfoques LPS actuales suelen obviar la variabilidad en la capa de datos, crítica en sistemas intensivos en datos.

    Esta tesis aborda tres retos en la evolución de este tipo de sistemas: reducir los costes de reingeniería, facilitar la migración de datos y mejorar la sostenibilidad a largo plazo. Para ello, presentamos tres contribuciones principales. Primero, un enfoque de modelado de datos que incorpora la variabilidad y se integra con plataformas LPS, permitiendo la generación automática del sistema y su base de datos.

    Segundo, DAMI-Framework, un framework que agiliza la migración de datos mediante un lenguaje específico de dominio que automatiza la correspondencia de esquemas y la transformación de datos. Tercer, SPL-DB-Sync, que permite la evolución semiautomática de los sistemas generados y sus bases de datos, adaptándolos a los cambios en las características del producto y asegurando la coherencia y la integridad de los datos persistidos.

    Las herramientas y técnicas propuestas han sido validadas con casos de estudio y evaluaciones empíricas, demostrando reducciones significativas del esfuerzo manual y mejoras en la adaptabilidad. Al avanzar en la automatización de la reingeniería y evolución de sistemas intensivos en datos, esta tesis aporta soluciones prácticas y escalables que mejoran la sostenibilidad, mantenibilidad y eficiencia de los sistemas de información actuales. Como trabajo futuro, se propone avanzar en la automatización, la escalabilidad y la fiabilidad de las técnicas desarrolladas para facilitar su adopción.

  • English

    Modern organizations increasingly rely on data-intensive information systems to support critical business processes. These systems, often built with high variability to meet diverse customer needs, must continuously evolve to accommodate changing requirements, regulations, and technologies. Over time, the accumulated complexity, outdated technologies, and inconsistent system variants can render these systems obsolete, necessitating their reengineering. Traditional reengineering approaches, particularly when dealing with multiple similar legacy systems, are costly, laborintensive, and frequently managed in an ad-hoc manner. Software Product Line (SPL) engineering offers a promising solution for reengineering families of related systems by promoting systematic variability management and component reuse.

    However, existing SPL approaches largely overlook variability in the data layer, which is critical in data-intensive systems.

    This thesis addresses three key challenges in reengineering and evolving dataand variability-intensive legacy systems: reducing reengineering costs and effort, enabling seamless data migration, and improving long-term system sustainability.

    To tackle these challenges, this work introduces three main contributions. First, a variability-aware data modeling approach is proposed, which integrates with SPL platforms to enable the automatic generation of system variants, including their databases. Second, the DAMI-Framework is developed to support seamless data migration through a domain-specific language that automates schema mapping and data transformation. Third, SPL-DB-Sync is introduced to enable the semiautomated evolution of deployed system databases as features are added or removed, ensuring the consistency and adaptability of persistent data across evolving product variants.

    The proposed frameworks and techniques have been validated through realworld case studies and empirical evaluations, demonstrating significant reductions in manual effort and improvements in system adaptability. By advancing automation in the reengineering and evolution of data-intensive systems, this thesis contributes practical, scalable solutions that enhance the sustainability, maintainability, and efficiency of modern information systems. Future work should enhance automation, scalability, and reliability to support broader adoption of the proposed techniques.

  • galego

    As organizacións actuais dependen cada vez máis de sistemas de información intensivos en datos para dar soporte aos seus procesos de negocio. Estes sistemas, deseñados cunha alta variabilidade para satisfacer as diversas necesidades dos clientes, evolucionan continuamente para adaptarse a cambios nos requerimentos, normativas e tecnoloxías. Co paso do tempo, a complexidade acumulada, as tecnoloxías obsoletas e as inconsistencias poden voltar estes sistemas ineficaces, facendo necesaria a reenxeñaría. Os enfoques tradicionais de reenxeñaría, sobre todo no caso de múltiples sistemas herdados similares, adoitan ser custosos e xestionarse de forma ad hoc.

    A enxeñaría de Liñas de Produtos Software (LPS) ofrece unha solución para a reenxeñaría de familias de sistemas enlazados, fomentando a xestión sistemática da variabilidade e a reutilización de compoñentes, aínda que os enfoques actuais adoitan obviar a variabilidade na capa de datos, crítica nos sistemas intensivos en datos.

    Esta tese aborda tres retos na evolución deste tipo de sistemas: reducir os custos da reenxeñaría, facilitar a migración de datos e mellorar a sustentabilidade a longo prazo. Para iso, preséntanse tres contribucións principais. En primeiro lugar, un enfoque de modelado de datos que incorpora a variabilidade e se integra con plataformas LPS, permitindo a xeración automática do sistema e da súa base de datos.

    En segundo lugar, DAMI-Framework, un marco que axiliza a migración de datos mediante unha linguaxe específica de dominio que automatiza a correspondencia de esquemas e a transformación dos datos. En terceiro lugar, SPL-DB-Sync, que permite a evolución semiautomática dos sistemas xerados e das súas bases de datos, adaptándoos aos cambios nas características do produto e garantindo a coherencia e integridade dos datos persistidos.

    As ferramentas e técnicas propostas foron validadas con casos de estudo e avaliacións empíricas, demostrando reducións significativas no esforzo manual e melloras na adaptabilidade. Ao avanzar na automatización da reenxeñaría e evolución de sistemas intensivos en datos, esta tese achega solucións prácticas e escalables que melloran a sustentabilidade, mantibilidade e eficiencia dos sistemas de información actuais. Como liña de traballo futuro, proponse continuar mellorando a automatización, escalabilidade e fiabilidade das técnicas desenvolvidas para facilitar a súa adopción.


Fundación Dialnet

Mi Documat