Esta tesis, presentada como un compendio de artículos de investigación, aborda la predicción de series temporales en un entorno de streaming mediante técnicas de deep learning. En primer lugar, se aporta un innovador framework asíncrono para la aplicación de modelos deep learning a datos provenientes de un stream a gran velocidad. Además, se realiza un exhaustivo estudio sobre la aplicabilidad de los métodos de deep learning para el problema de predicción de series temporales. La minería de datos en streaming es un problema fundamental aplicable a una gran multitud de campos donde los datos son generados secuencialmente a gran velocidad. Los requisitos de velocidad que caracterizan este escenario no permiten el uso de técnicas de deep learning, las cuales presentan un gran coste computacional. En esta tesis presentamos una solución a este problema: un framework asíncrono (ADLStream) que separa las fases de entrenamiento y predicción de los modelos de entrenamiento, aliviando así el coste computacional de los modelos y permitiéndoles adaptarse a la evolución de los datos a lo largo del tiempo. Esta propuesta ha sido evaluada experimentalmente usando diversos conjuntos de datos de clasificación de series temporales y comparándolo con los modelos del estado del arte para la minería de datos en streaming, como son los árboles de Hoeffding, detectores de deriva o modelos ensembles. Los resultados demostraron la mejora en el rendimiento conseguida con nuestra propuesta. La predicción de series temporales es uno de los problemas de aprendizaje automático y estadísticos más comunes, engloba todas los datos que tienen una componente temporal, presentes en problemas meteorológicos, energéticos, médicos, logísticos o financiarios. La irrupción del aprendizaje profundo (deep learning) como estado del arte en la minería de datos, ha beneficiado a la investigación relacionada con la predicción de series temporales. Por ello, en esta tesis presentamos el estudio experimental más completo sobre la aplicabilidad de deep learning para la predicción de series temporales. Más de 50000 series temporales fueron usadas para este estudio, donde entrenamos y evaluamos un total de 3800 modelos de diferentes arquitecturas: perceptrón multicapa (MLP), red neuronal recurrente de Elman (ERNN), red recurrente LSTM (long-short term memory), red recurrente GRU (gated recurrent unit), red recurrente ESN (echo state network), red neuronal convolucional (CNN), red convolucional temporal (TCN) y el Transformer. Los resultados de estos experimentos muestran que las redes LSTM y CNN son las mejores alternativas. La LSTM consiguió obtener las predicciones más acertadas, mientras que las CNN lograron un rendimiento comparable pero con una variabilidad menor y un menor coste computacional. La última contribución presentada en esta tesis tiene como objetivo combinar las dos principales temáticas, tanto la predicción de series temporales como la minería de datos en streaming, en una aplicación real como es la predicción de la irradiancia solar. La crisis climática y energética ha acelerado la búsqueda de fuentes de energías renovables, y concretamente la energía solar, ya que se presenta como una de las fuentes más prometedoras. Para la gestión de los parques fotovoltaicos, es necesario llevar a cabo una correcta balanceo de carga, lo cual necesita de una predicción acertada de la irradiancia a corto plazo. En esta tesis presentamos una solución basada en el framework ADLStream y en modelos de deep learning para predecir la irradiancia solar de los paneles solares de un parque fotovoltaico canadiense en streaming. Los resultados obtenidos confirman la idoneidad de esta solución, obteniendo predicciones muy acertadas y demostrando una gran capacidad de adaptación a la evolución de los datos del stream.
This thesis addresses the problem of time series forecasting in a streaming scenario using deep learning techniques. Firstly, it provides an innovative asynchronous framework for the application of deep learning models to data from a high-speed stream. In addition, an extensive study on the applicability of deep learning methods to the time series prediction problem is carried out. Data stream mining is a fundamental problem applicable to a multitude of fields where data is generated sequentially at high speed. The speed requirements that characterise this scenario do not allow the use of deep learning techniques, which are computationally expensive. In this work we present a solution to this problem - an asynchronous framework (ADLStream) that separates the training and prediction phases of the training models, thus alleviating the computational cost of the models and allowing them to adapt to the evolution of the data distribution. This proposal has been experimentally evaluated using different time series classification datasets and compared with state-of-the-art models for data stream mining, such as Hoeffding trees, drift detectors or ensemble models. The results demonstrated the performance improvement achieved with our proposal. Time series forecasting is one of the most common statistical and machine learning problems, covering all data with a temporal component, such as meteorological, energy, medical, logistical or financial data. The emergence of deep learning as the state-of-the-art in data mining has benefited research related to time series forecasting. Therefore, we present the most comprehensive experimental study on the applicability of deep learning for time series forecasting. More than 50,000 time series were used for this study. We trained and evaluated a total of 3,800 models of different architectures: multilayer perceptron (MLP), Elman recurrent neural network (ERNN), long-short term memory network (LSTM), gated recurrent unit network (GRU), echo state network (ESN), convolutional neural network (CNN), temporal convolutional network (TCN) and Transformer. The results of these experiments show that the LSTM and CNN networks are the best alternatives. The LSTM managed to obtain the most accurate predictions, while the CNN achieved comparable performance with lower variability and lower computational cost. The last contribution presented in this thesis aims to combine the two main topics, both time series forecasting and data stream mining, into a real application such as solar irradiance forecasting. The climate and energy crisis has accelerated the search for renewable energy sources, and solar energy in particular as it is one of the most promising sources. For the management of photovoltaic parks, it is necessary to carry out a correct load balancing, which requires an accurate prediction of the solar irradiance in the short term. In this work, we present a solution based on the ADLStream framework and deep learning models to predict the solar irradiance of the PV sensors of a streaming Canadian solar grid. The results obtained confirm the ideonality of this solution, obtaining very accurate predictions and demonstrating a great capacity to adapt to the evolution of the stream data.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados