Ir al contenido

Documat


Resumen de Machine Learning: Requisitos y nuevas técnicas para la aplicación en entornos industriales e Internet of Things

José Manuel Barrera Arroyo

  • Con la conversión de la industria tradicional a industria 4.0, la inteligencia artificial (IA), Internet de las Cosas (IoT), el Machine Learning (ML) y la calidad de los datos (DQ) adquieren nuevas dimensiones y una notoria relevancia en el campo de la industria. Uno de los usos más solicitados de la IA en el campo de la industria es la búsqueda de la mejora de la rentabilidad, ya sea aumentando la producción, o disminuyendo los costes del propio proceso industrial. En esta tesis se abordan los dos objetivos: para la optimización de producción, se presenta un sistema para la cuantificación de energía generada para instalaciones solares fotovoltaicas. Este modelo está basado en Open Data provenientes de satélites, sensores IoT y Redes Neuronales Artificiales (ANN). Así, facilitamos a los lectores la información necesaria para decidir cuánto deberían invertir en una ubicación en concreto, en función de la producción energética deseada. En comparación con las propuestas más avanzadas, nuestra solución proporciona una capa de abstracción centrada en la producción de energía, en lugar de en los datos de radiación, y puede entrenarse y adaptarse a diferentes ubicaciones utilizando Open Data. Por otra parte, para la disminución de costes del propio proceso industrial, se presenta un modelo de ML basado en autoencoders que permite la Detección y el Diagnosis de Errores (FDD) y acorta las interrupciones del proceso productivo. El enfoque presentado explota los datos generados por el proceso industrial y entrena una arquitectura basada en ML, combinando varios algoritmos con autoencoders y ventanas deslizantes. La solución presentada ayuda a detectar precozmente las averías y se ha sido probada con datos reales procedentes de una instalación con una turbina de cogeneración de energía eléctrica. Además, se destaca que, aunque el ejemplo usado para nuestro enfoque utiliza una instalación industrial de una turbina de gas, éste puede adaptarse a otros problemas de FDD en otros procesos industriales que podrían beneficiarse de las ventajas mencionadas. Sin embargo, durante la realización del proyecto se han encontrado dos dificultades adicionales: que no existe una metodología establecida para la captación de requisitos para proyectos de ML; y que no existe información adecuada y suficiente sobre el efecto de las desviaciones de la Calidad de lo Datos (DQ) en dichos modelos ML. Por consiguiente, en esta tesis se presentan dos soluciones adicionales para dichos problemas. Para solventar la captación de requisitos en proyectos de ML, se presenta una particularización del modelo de requisitos iStar (i*). Mediante esta particularización, los recién llegados y los no expertos en el campo del ML pueden seguir una metodología que les guiará por el camino correcto a seguir, evitando modelos no válidos. El marco i* es un popular lenguaje de modelado para capturar el entorno y los requisitos de un sistema. Sin embargo, se ha construido sobre una capa de abstracción muy alta, y sus usos en un campo específico dependen en gran medida de la experiencia del diseñador. La propuesta presentada resuelve esto: especifica el marco i*, cubriendo las principales lagunas entre el ML y el modelado conceptual. Así, proporcionamos una línea de base adecuada a seguir que captura los requisitos y cumple las numerosas restricciones del campo del ML. Además, se presenta una guía basada en preguntas para aplicar dicha propuesta, y se aplica la metodología descrita en el proyecto de la turbina de gas descrito previamente. Así, se puede ver su viabilidad y cómo su uso filtra diseños no válidos. Respecto al punto de ver la cuantificación del efecto de DQ en los proyectos de ML, en esta tesis se presenta un enfoque sistemático, basado en la norma ISO 25012, para estimar el impacto de la degradación de la DQ en diferentes algoritmos, con el fin de cuantificar dicho efecto en la salida de un modelo de ML de una instalación real (la de la turbina de gas de cogeneración). Se debe destacar que en una instalación real puede haber fuertes restricciones de tiempo y espacio, y la limpieza de datos como tal no siempre es posible, por lo que el modelo de ML debe lidiar de con dichos problemas de DQ. Para ello, se ha definido una metodología mediante la cual, se contamina progresivamente los datos para disminuir dos características de D, accuracy y currentness. Como resumen, la tesis se centra en 4 puntos: optimización de un proceso industrial de generación solar fotovoltaica, mejora en el mantenimiento industrial mediante mantenimiento predictivo en una instalación real, metodología para la captación de requisitos en un proyecto de ML, y efectos de DQ sobre las salidas de los modelos de ML en un entorno industrial. Así pues, esta tesis mejora de manera integral distintos aspectos relacionados con el ML, el IoT y las instalaciones industriales.


Fundación Dialnet

Mi Documat