Ir al contenido

Documat


Modelos de árboles de decisión incrementales en flujos de datos aplicados al mantenimiento predictivo

  • Autores: Aurora Esteban Toscano
  • Directores de la Tesis: Sebastián Ventura Soto (dir. tes.) Árbol académico, Amelia Zafra Gómez (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Córdoba (ESP) ( España ) en 2024
  • Idioma: español
  • Tribunal Calificador de la Tesis: João Manuel Portela da Gama (presid.) Árbol académico, Eva Gibaja Galindo (secret.) Árbol académico, Pedro González Garcia (voc.) Árbol académico
  • Enlaces
    • Tesis en acceso abierto en: Helvia
  • Resumen
    • 1. Introducción o motivación de la tesis: La proliferación de sensores y dispositivos conectados en los entornos ciber-físicos modernos ha provocado un aumento sin precedentes en la generación de datos secuenciales. Estos datos, ya sea en forma de series temporales o de flujos continuos, contienen información crucial sobre el comportamiento, el rendimiento y la salud de los sistemas.

      Esto reviste especial importancia en el campo del mantenimiento predictivo, una aplicación que ha adquirido gran relevancia en el entorno industrial debido a su objetivo de minimizar los tiempos y las operaciones de mantenimiento mediante el análisis de datos y el aprendizaje automático para predecir cuándo pueden producirse fallos en los equipos.

      Sin embargo, las dependencias temporales inherentes, la alta dimensionalidad y la naturaleza a menudo ilimitada de estos tipos de datos plantean retos significativos a los enfoques analíticos tradicionales. Existe una necesidad de modelos de aprendizaje automático eficientes, escalables e interpretables capaces de extraer conocimientos procesables de estos datos secuenciales complejos, particularmente en el contexto del mantenimiento predictivo para la Industria 4.0 y los paradigmas emergentes de la Industria 5.0.

      Esta tesis aborda estos desafíos mediante el desarrollo de nuevos métodos de aprendizaje automático para el análisis de datos secuenciales, centrándose en la flexibilidad, la escalabilidad y la interpretabilidad. La investigación aborda cuestiones clave en la clasificación de series temporales o las representaciones flexibles y las aplicaciones de mantenimiento predictivo, con árboles de decisión incrementales como el punto de intersección donde se cruzan las diferentes contribuciones de esta tesis.

      Los árboles de decisión incrementales emergen como un paradigma prometedor para abordar estos retos. Estos modelos ofrecen una combinación única de adaptabilidad, interpretabilidad y eficiencia, lo que los hace muy adecuados para manejar flujos de datos dinámicos y de alta dimensionalidad. A diferencia de los métodos tradicionales de aprendizaje por lotes, los árboles de decisión incrementales pueden actualizar continuamente la estructura de su modelo a medida que llegan nuevos datos, adaptándose a la evolución de los patrones y a la deriva de concepto. Su estructura jerárquica proporciona rutas de decisión claras, ofreciendo perspectivas interpretables cruciales para el apoyo a la toma de decisiones en diversas aplicaciones. Esta tesis aprovecha y amplía las capacidades de los árboles de decisión incrementales para desarrollar nuevos enfoques de análisis de datos secuenciales complejos.

      En el ámbito del análisis de grandes volúmenes de datos, los métodos tradicionales de aprendizaje supervisado suelen tener dificultades con el enorme volumen y complejidad de los datos, sobre todo en entornos industriales en los que etiquetar grandes conjuntos de datos puede resultar caro o poco práctico. Las representaciones de datos no estándar, como el aprendizaje multi-instancia y el aprendizaje multi-etiqueta, ofrecen valiosas soluciones a estos retos. El aprendizaje multi-instancia permite representar objetos complejos como bolsas de instancias, en las que sólo se etiqueta la bolsa, lo que reduce la granularidad de las anotaciones necesarias. El aprendizaje multi-etiqueta, por su parte, permite manejar múltiples etiquetas por instancia, capturando la complejidad de los escenarios del mundo real en los que pueden coexistir múltiples condiciones o estados. Mediante la integración de estas representaciones flexibles con árboles de decisión incrementales, esta tesis desarrolla nuevos enfoques que pueden aprender eficazmente a partir de datos poco etiquetados o parcialmente etiquetados, mejorando significativamente la aplicabilidad del aprendizaje automático en contextos industriales de big data.

      2.Contenido de la investigación: En resumen, las principales aportaciones de esta tesis son:

      1. Desarrollo de modelos novedosos basados en árboles de decisión incrementales que procesan eficientemente flujos de datos y utilizan representaciones de información no estándar: - Un enfoque pionero para la clasificación de series temporales que integra el aprendizaje multi-instancia con árboles incrementales, permitiendo un aprendizaje efectivo a partir de datos flexibles en entornos débilmente etiquetados (MIHT: Multi-Instance Hoeffding Tree).

      - Una propuesta innovadora para el aprendizaje en línea en flujos de datos multi-etiqueta, aprovechando los árboles incrementales para capturar dinámicamente las correlaciones de etiquetas (MLHAT: Multi-Label Hoeffding Adaptive Tree).

      Estos modelos se evalúan rigurosamente utilizando diversos puntos de referencia de múltiples aplicaciones del mundo real, validando su precisión, rendimiento y adaptabilidad a los flujos de datos y conjuntos de datos a gran escala en comparación con los métodos del estado del arte.

      2. Una revisión exhaustiva del campo del mantenimiento predictivo desde la perspectiva del aprendizaje automático [1], que proporciona información valiosa sobre técnicas clave, tendencias actuales y lagunas en las aplicaciones de mantenimiento predictivo.

      3. Desarrollo de modelos especializados para el mantenimiento predictivo, partiendo de los fundamentos teóricos establecidos para la clasificación de series temporales y el aprendizaje en línea con representaciones no estándar. Estos modelos aprovechan el aprendizaje incremental para actualizar continuamente las predicciones a medida que se recibe nueva información, lo que resulta crucial para detectar patrones emergentes y anticipar posibles fallos del sistema: - Un modelo de clasificación de series temporales que combina la representación multi-instancia y los árboles incrementales para diagnosticar el estado de degradación del sistema en escenarios de mantenimiento predictivo (MIHATT: Multi-Instance Hoeffding Anytime Tree for Predictive Maintenance).

      - Modelos de clasificación múltiple basados en conjuntos en línea de árboles incrementales para el aprendizaje multietiqueta, diseñados para identificar múltiples fallos en sistemas industriales dinámicos (OEMLHAT: Online Ensemble of Multi-Label Hoeffding Adaptive Trees for Predictive Maintenance).

      Estos modelos se evalúan en problemas industriales del mundo real, demostrando un rendimiento superior en comparación con enfoques anteriores y proporcionando valiosos conocimientos sobre las causas de los fallos, derivados de la interpretabilidad de los modelos propuestos.

      3.Conclusión: Esta tesis ha hecho avances significativos en el campo del mantenimiento predictivo mediante el desarrollo de nuevos métodos aprendizaje automático para el análisis de datos secuenciales, con un enfoque en la representación flexible de datos, escalabilidad e interpretabilidad. La investigación ha abordado con éxito retos clave en aplicaciones de clasificación de series temporales, aprendizaje online y mantenimiento predictivo, introduciendo enfoques innovadores que combinan aprendizaje multi-instancia y aprendizaje multi-etiqueta con árboles de decisión incrementales. Las principales conclusiones de esta tesis se resumen en los siguientes puntos:

      1. La tesis ha desarrollado con éxito nuevos métodos de clasificación de series temporales, como demuestra el enfoque MIHT. Este método combina eficazmente aprendizaje multi-instancia con un árbol de decisión incremental para manejar diversos tipos de series temporales, demostrando un rendimiento competitivo en los conjuntos de datos públicos a través de diversos dominios.

      2. La investigación ha logrado avances significativos en aprendizaje multi-etiqueta en línea mediante el desarrollo de MLHAT. Este novedoso enfoque adapta árboles de decisión incrementales para entornos multi-etiqueta, capturando eficazmente las relaciones entre etiquetas y adaptándose a la deriva de conceptos en los flujos de datos.

      3. Se ha presentado una revisión exhaustiva del campo del mantenimiento predictivo desde la perspectiva del aprendizaje automático, cumpliendo el objetivo de identificar las técnicas clave y las necesidades del sector. Esta revisión proporciona información valiosa sobre las tendencias actuales y las lagunas en las aplicaciones de mantenimiento predictivo.

      4. La tesis ha diseñado con éxito modelos precisos e interpretables para mantenimiento predictivo, como demuestran la propuesta MIHATT y los métodos OEMLHAT. Estos modelos proporcionan información práctica sobre la degradación de los activos industriales, equilibrando el rendimiento predictivo con la interpretabilidad.

      5. Los métodos para mantenimiento predictivo propuestos han sido rigurosamente validados en múltiples conjuntos de datos industriales del mundo real a través de diferentes dominios, confirmando su eficacia y aplicabilidad en diversos escenarios.

      En conclusión, esta tesis ha hecho contribuciones sustanciales a los campos de la clasificación de series temporales, el aprendizaje multi-etiqueta en línea y el mantenimiento predictivo, introduciendo nuevos métodos de aprendizaje automático que abordan desafíos críticos en el manejo de datos secuenciales complejos. La investigación proporciona una base sólida para futuros avances en técnicas de aprendizaje automático adaptativo, interpretable y escalable para aplicaciones industriales en la era de la Industria 4.0 y más allá.

      4. Bibliografía: [1] Aurora Esteban, Amelia Zafra, and Sebastián Ventura. "Data mining in predictive maintenance systems: A taxonomy and systematic review". In: WIREs: Data Mining and Knowledge Discovery (2022), pp. 1-45. doi: 10.1002/widm.1471


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno