Ir al contenido

Documat


Semi-supervised learning and survival analysis in biological and health sciences

  • Autores: Alicia Olivares Gil
  • Directores de la Tesis: Juan José Rodríguez Diez (codir. tes.) Árbol académico, José Francisco Díez Pastor (codir. tes.) Árbol académico
  • Lectura: En la Universidad de Burgos ( España ) en 2025
  • Idioma: español
  • Enlaces
    • Tesis en acceso abierto en: RIUBU
  • Resumen
    • El aprendizaje automático se ha hecho presente en casi todos los campos del conocimiento y prospera en presencia de datos ricamente etiquetados. Sin embargo, en muchos contextos biomédicos y de salud, las etiquetas suelen ser escasas, costosas o incompletas. Esta tesis doctoral investiga dos familias metodológicas que buscan aliviar esta limitación: el aprendizaje semisupervisado, que aprovecha la abundancia de datos no etiquetados, y el análisis de supervivencia, que modela objetivos censurados de «tiempo hasta el evento», comunes en estudios clínicos. A través de casos reales en ingeniería de proteínas y pronóstico de insuficiencia cardíaca crónica, el trabajo explora cómo estas técnicas pueden ofrecer modelos precisos e interpretables, al tiempo que reducen los costes de etiquetado. Para establecer un marco común para una audiencia multidisciplinar, esta tesis primero revisa conceptos teóricos y prácticos esenciales en aprendizaje automático, bioinformática y análisis de supervivencia. El resto de esta tesis comprende varios trabajos de investigación con objetivos y motivaciones particulares, pero con un tema subyacente común: • La adaptación de métodos de aprendizaje semisupervisado a problemas de regresión. • El estudio de la efectividad de técnicas de regresión semisupervisada en el campo de la ingeniería de proteínas. • La aplicación de métodos de análisis de supervivencia basados en estadística y aprendizaje automático para el pronóstico de insuficiencia cardíaca crónica. • La evaluación de la influencia de características en la hospitalización relacionada con insuficiencia cardíaca utilizando métodos muy novedosos. • La exploración de la intersección entre el aprendizaje semisupervisado y el análisis de supervivencia mediante el desarrollo de nuevas técnicas. Estas contribuciones tienen varias implicaciones. En primer lugar, se propone un nuevo método semisupervisado de tipo wrapper llamado Tri-Training Regressor, competitivo con métodos del estado del arte. En segundo lugar, demostramos que usar técnicas de aprendizaje semisupervisado puede mejorar significativamente la precisión predictiva en el campo de la ingeniería de proteínas, al mismo tiempo que mitiga el cuello de botella de los datos etiquetados limitados. En tercer lugar, evaluamos la precisión de modelos clásicos y recientes de análisis de supervivencia para el pronóstico de insuficiencia cardíaca crónica, con un énfasis particular en la importancia de la interpretabilidad de los modelos predictivos utilizados en pronósticos de salud. Finalmente, desarrollamos un nuevo método que transforma problemas de análisis de supervivencia en problemas de clasificación binaria semisupervisada, y demostramos su eficacia al tratar con conjuntos de datos anchos


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno