Boopstrap como estrategia para la estabilización de las soluciones sparse en modelos tensoriales. Aplicado al modelo CenetTucker

Gresky Gutiérrez Sánchez

Ayuda

Boopstrap como estrategia para la estabilización de las soluciones sparse en modelos tensoriales. Aplicado al modelo CenetTucker

Autores: Gresky Gutiérrez Sánchez
Directores de la Tesis: Purificación Vicente Galindo (dir. tes.) , Purificación Galindo Villardón (codir. tes.)
Lectura: En la Universidad de Salamanca ( España ) en 2025
Idioma: español
Tribunal Calificador de la Tesis: María Angélica González Arrieta (presid.) , Eugenia Maria Maia Ferreira Castela (secret.) , Cristian Cornejo Gaete (voc.)
Enlaces
- Tesis en acceso abierto en: TESEO GREDOS
Resumen
- español
  Esta tesis doctoral aborda un desafío metodológico clave en el análisis de datos de alta dimensión: la inestabilidad de las soluciones dispersas en modelos tensoriales penalizados. Específicamente, propone un marco teórico y computacional que integra técnicas de remuestreo Bootstrap con la descomposición de Tucker penalizada por Elastic Net —conocida como el modelo CenetTucker— para mejorar la estabilidad y la reproducibilidad de la selección de factores latentes. La investigación se estructura en torno a tres pilares principales: (i) una revisión exhaustiva de los fundamentos teóricos y las limitaciones de las soluciones dispersas en datos con estructura tensorial, (ii) la formalización e implementación de un procedimiento de estabilización basado en Bootstrap adaptado al modelo CenetTucker, y (iii) la evaluación empírica de la estabilidad del modelo mediante experimentos simulados y conjuntos de datos reales. Como contribución aplicada, la tesis introduce un paquete de R llamado GSparseBoot, que automatiza el ajuste del modelo, el remuestreo y el cálculo de métricas de estabilidad —incluida la frecuencia de inclusión de variables, el índice de Jaccard, la variabilidad del soporte y el índice de selección estable. Aunque el paquete aún no se ha publicado en CRAN, su desarrollo está completo y su lanzamiento público se encuentra en proceso. Los resultados demuestran que la incorporación de Bootstrap reduce significativamente la variabilidad estructural de las soluciones penalizadas sin comprometer la interpretabilidad ni el rendimiento predictivo. Esta mejora es particularmente evidente en escenarios con alta colinealidad o estructuras latentes débiles, donde los enfoques tradicionales tienden a ser inestables. Además, se propone un conjunto de métricas de estabilidad personalizadas para evaluar rigurosamente la consistencia entre réplicas de remuestreo en contextos multidireccionales. Este trabajo ofrece una contribución metodológica original en la intersección de la estadística computacional, la factorización tensorial y la regularización. Proporciona una base matemática sólida, una implementación computacional reproducible y herramientas prácticas para apoyar estudios científicos en genómica, neurociencia, análisis de datos sensoriales y otros dominios donde la reproducibilidad estadística es fundamental. En general, esta tesis impulsa el desarrollo de modelos estadísticos más robustos y fiables en la era de los datos complejos y de alta dimensionalidad.
- English
  This doctoral thesis addresses a key methodological challenge in high-dimensional data analysis: the instability of sparse solutions in penalized tensor models. Specifically, it proposes a theoretical and computational framework that integrates Bootstrap resampling techniques with the Elastic Net-penalized Tucker decomposition —known as the CenetTucker model— to enhance the stability and reproducibility of latent factor selection.
  
  The research is structured around three main pillars: (i) a comprehensive review of the theoretical foundations and limitations of sparse solutions in tensor-structured data, (ii) the formalization and implementation of a Bootstrap-based stabilization procedure tailored to the CenetTucker model, and (iii) the empirical evaluation of model stability through simulated experiments and real datasets. As an applied contribution, the thesis introduces an R package named GSparseBoot, which automates the model fitting, resampling, and computation of stability metrics —including variable inclusion frequency, Jaccard index, support variability, and stable selection index. While the package is not yet published on CRAN, its development is complete, and its public release is currently in process.
  
  Results demonstrate that incorporating Bootstrap significantly reduces the structural variability of penalized solutions without compromising interpretability or predictive performance. This improvement is particularly evident in scenarios involving high collinearity or weak latent structures, where traditional approaches tend to be unstable.
  
  Additionally, a set of tailored stability metrics is proposed to rigorously assess consistency across resampling replicates in multi-way contexts.
  
  This work offers an original methodological contribution at the intersection of computational statistics, tensor factorization, and regularization. It provides a solid mathematical foundation, a reproducible computational implementation, and practical tools to support scientific studies in genomics, neuroscience, sensory data analysis, and other domains where statistical reproducibility is paramount. Overall, this thesis advances the development of more robust and reliable statistical models in the era of complex, highdimensional data.
  
  Índice