Ir al contenido

Documat


Contrastive Modeling and Signal Representation for Anomaly Detection and Diagnosis

  • Autores: Jiapeng Wu
  • Directores de la Tesis: Fernando Sancho Caparrini (dir. tes.) Árbol académico, Diego Román Cabrera Mendieta (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Sevilla ( España ) en 2025
  • Idioma: inglés
  • Número de páginas: 138
  • Enlaces
    • Tesis en acceso abierto en: Idus
  • Resumen
    • español

      En el ámbito de la Gestión Predictiva y Salud de Activos (PHM), la escasez de datos etiquetados sobre fallos y la diversidad de condiciones operativas plantean desafíos significativos para la detección confiable de anomalías en maquinaria industrial. Los métodos tradicionales de procesamiento de señales y aprendizaje automático requieren una experiencia considerable en el dominio específico y presentan dificultades para operar en entornos dinámicos y no estacionarios. Si bien el aprendizaje profundo ofrece soluciones integrales potentes, su dependencia de grandes conjuntos de datos etiquetados limita su aplicabilidad en escenarios reales, donde los datos correspondientes a estados saludables superan considerablemente a las muestras de fallo.

      Esta tesis aborda dichas limitaciones mediante el desarrollo de una serie de marcos de aprendizaje contrastivo y de clase única adaptados a entornos industriales caracterizados por la escasez de datos y alta variabilidad. Comenzando con el diagnóstico de fallos bajo condiciones de funcionamiento nominales, los métodos propuestos emplean aprendizaje contrastivo sin muestras negativas para extraer representaciones informativas utilizando únicamente una cantidad limitada de datos de fallo, mientras que la generalización se logra en condiciones de trabajo variables mediante muestras normales compartidas e incorporadas durante el entrenamiento.

      Para reducir aún más la dependencia de muestras de fallo, la investigación se orienta hacia la detección de anomalías de clase única utilizando exclusivamente datos en estado saludable. Una innovación clave en esta etapa es la integración del aprendizaje contrastivo en un marco de clasificación de clase única que resuelve el problema del colapso de características durante el entrenamiento. Esto se complementa con una estrategia de aumento de características aprendible dentro del Marco OCCRF propuesto, que permite una implementación eficiente en GPU y supera tanto a los métodos clásicos como a los basados en reconstrucción para la detección de anomalías. Adicionalmente, se introduce una estrategia de aumento entre condiciones más sencilla, que utiliza datos normales de otras condiciones operativas para reemplazar los aumentos menos interpretables empleados habitualmente en las tareas tradicionales de clasificación en PHM.

      La tesis culmina con un marco de generalización de dominios que combina el aprendizaje contrastivo y el entrenamiento adversarial dentro de una estructura de desenredamiento de características, lo que permite la extracción de representaciones invariantes al dominio incluso bajo condiciones no estacionarias. Este enfoque logra un rendimiento robusto sin requerir acceso a los datos del dominio objetivo. Paralelamente, se desarrolla un modelo basado en mecanismos de atención para procesar directamente las señales de series temporales sin procesar, eliminando la necesidad de preprocesamiento en el dominio de la frecuencia. Esto mejora la eficiencia computacional y la aplicabilidad en tiempo real.

      Las evaluaciones exhaustivas realizadas en múltiples conjuntos de datos —incluyendo señales de vibración no estacionarias provenientes de un conjunto de datos público sobre rodamientos y de un banco de pruebas de compresores alternativos recopilado por el grupo de investigación, así como señales estacionarias obtenidas de un banco de pruebas de bombas centrífugas multietapa también desarrollado internamente— demuestran la efectividad y robustez de los métodos propuestos. En conjunto, estas contribuciones allanan el camino hacia sistemas de monitorización autónomos y autoadaptables alineados con aplicaciones de gemelos digitales. Las investigaciones futuras extenderán estos marcos hacia la fusión de sensores multimodales, el aprendizaje de representaciones causales y los sistemas de diagnóstico de bucle cerrado para mejorar aún más la interpretabilidad y la capacidad de toma de decisiones en entornos industriales complejos.

    • English

      In the field of industrial Prognostics and Health Management (PHM), the scarcity of labeled fault data and the diversity of operating conditions pose significant challenges for the reliable detection of machinery anomalies. Traditional signal processing and machine learning methods require substantial domain expertise and struggle to perform under dynamic and non-stationary environments. Although deep learning offers powerful end-to-end solutions, its reliance on large labeled datasets limits its applicability in real-world scenarios, where healthy-state data vastly outnumber fault samples.

      This thesis addresses these limitations by developing a series of contrastive-learning-based and one-class learning frameworks tailored to data-scarce, highly variable industrial environments. Beginning with fault diagnosis under nominal operating conditions, the proposed methods employ negative-sample-free contrastive learn-ing to extract informative representations using only limited faulty data, while generalization is achieved across varying working conditions with shared normal samples included during training.

      To further reduce dependence on faulty samples, the research transitions to one-class anomaly detection using only healthy-state data. A key innovation at this stage is the integration of contrastive learning into a one-class classification frame-work that resolves the feature collapse issue during training. This is complemented by a learnable feature augmentation strategy within the proposed One-Class Con-trastive Reconstruction Framework (OCCRF), which supports GPU-efficient de-ployment and surpasses both classical and reconstruction-based anomaly detec-tion methods. Additionally, a simpler cross-condition augmentation strategy is introduced, utilizing normal data from other operating conditions to replace the less interpretable augmentations commonly used in traditional PHM classification tasks.

      The thesis culminates in a domain generalization framework that combines con-trastive learning and adversarial training within a feature disentanglement struc-ture, enabling the extraction of domain-invariant representations even under non-stationary conditions. This approach achieves robust performance without requir-ing access to target domain data. In parallel, an attention-based model is devel-oped to process raw time-series signals directly, removing the need for frequency-domain preprocessing. This enhances computational efficiency and real-time ap-plicability.

      Extensive evaluations on several datasets—including non-stationary vibration sig-nals from a public bearing dataset and a self-collected reciprocating compressor testbed, as well as stationary signals from a self-collected multistage centrifu-gal pump testbed—demonstrate the effectiveness and robustness of the proposed methods. Collectively, these contributions pave the way toward autonomous, self-adaptive monitoring systems aligned with digital twin applications. Future re-search will extend these frameworks to multimodal sensor fusion, causal repre-sentation learning, and closed-loop diagnostic systems to further enhance inter-pretability and decision-making capabilities in complex industrial settings.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno