dc.contributor.advisor | Luna Romera, José María | es |
dc.contributor.advisor | Riquelme Santos, José Cristóbal | es |
dc.creator | Lara Benítez, Pedro | es |
dc.date.accessioned | 2022-08-25T10:07:52Z | |
dc.date.available | 2022-08-25T10:07:52Z | |
dc.date.issued | 2022-06-27 | |
dc.identifier.citation | Lara Benítez, P. (2022). Predicción de series temporales en streaming mediante Deep Learning. (Tesis Doctoral Inédita). Universidad de Sevilla, Sevilla. | |
dc.identifier.uri | https://hdl.handle.net/11441/136449 | |
dc.description.abstract | Esta tesis, presentada como un compendio de artículos de investigación, aborda la predicción de
series temporales en un entorno de streaming mediante técnicas de deep learning. En primer lugar,
se aporta un innovador framework asíncrono para la aplicación de modelos deep learning a datos
provenientes de un stream a gran velocidad. Además, se realiza un exhaustivo estudio sobre la
aplicabilidad de los métodos de deep learning para el problema de predicción de series
temporales.
La minería de datos en streaming es un problema fundamental aplicable a una gran multitud de
campos donde los datos son generados secuencialmente a gran velocidad. Los requisitos de
velocidad que caracterizan este escenario no permiten el uso de técnicas de deep learning, las
cuales presentan un gran coste computacional. En esta tesis presentamos una solución a este
problema: un framework asíncrono (ADLStream) que separa las fases de entrenamiento y
predicción de los modelos de entrenamiento, aliviando así el coste computacional de los modelos
y permitiéndoles adaptarse a la evolución de los datos a lo largo del tiempo. Esta propuesta ha
sido evaluada experimentalmente usando diversos conjuntos de datos de clasificación de series
temporales y comparándolo con los modelos del estado del arte para la minería de datos en
streaming, como son los árboles de Hoeffding, detectores de deriva o modelos ensembles. Los
resultados demostraron la mejora en el rendimiento conseguida con nuestra propuesta.
La predicción de series temporales es uno de los problemas de aprendizaje automático y
estadísticos más comunes, engloba todas los datos que tienen una componente temporal, presentes
en problemas meteorológicos, energéticos, médicos, logísticos o financiarios. La irrupción del
aprendizaje profundo (deep learning) como estado del arte en la minería de datos, ha beneficiado
a la investigación relacionada con la predicción de series temporales. Por ello, en esta tesis
presentamos el estudio experimental más completo sobre la aplicabilidad de deep learning para la
predicción de series temporales. Más de 50000 series temporales fueron usadas para este estudio,
donde entrenamos y evaluamos un total de 3800 modelos de diferentes arquitecturas: perceptrón
multicapa (MLP), red neuronal recurrente de Elman (ERNN), red recurrente LSTM (long-short
term memory), red recurrente GRU (gated recurrent unit), red recurrente ESN (echo state
network), red neuronal convolucional (CNN), red convolucional temporal (TCN) y el
Transformer. Los resultados de estos experimentos muestran que las redes LSTM y CNN son las
mejores alternativas. La LSTM consiguió obtener las predicciones más acertadas, mientras que las
CNN lograron un rendimiento comparable pero con una variabilidad menor y un menor coste
computacional.
La última contribución presentada en esta tesis tiene como objetivo combinar las dos principales
temáticas, tanto la predicción de series temporales como la minería de datos en streaming, en una
aplicación real como es la predicción de la irradiancia solar. La crisis climática y energética ha
acelerado la búsqueda de fuentes de energías renovables, y concretamente la energía solar, ya que
se presenta como una de las fuentes más prometedoras. Para la gestión de los parques
fotovoltaicos, es necesario llevar a cabo una correcta balanceo de carga, lo cual necesita de una predicción acertada de la irradiancia a corto plazo. En esta tesis presentamos una solución basada
en el framework ADLStream y en modelos de deep learning para predecir la irradiancia solar de
los paneles solares de un parque fotovoltaico canadiense en streaming. Los resultados obtenidos
confirman la idoneidad de esta solución, obteniendo predicciones muy acertadas y demostrando
una gran capacidad de adaptación a la evolución de los datos del stream. | es |
dc.description.abstract | This thesis addresses the problem of time series forecasting in a streaming
scenario using deep learning techniques. Firstly, it provides an innovative
asynchronous framework for the application of deep learning models to data
from a high-speed stream. In addition, an extensive study on the applicability
of deep learning methods to the time series prediction problem is carried out.
Data stream mining is a fundamental problem applicable to a multitude
of fields where data is generated sequentially at high speed. The speed requirements
that characterise this scenario do not allow the use of deep learning
techniques, which are computationally expensive. In this work we present a
solution to this problem - an asynchronous framework (ADLStream) that
separates the training and prediction phases of the training models, thus
alleviating the computational cost of the models and allowing them to adapt
to the evolution of the data distribution. This proposal has been experimentally
evaluated using different time series classification datasets and compared
with state-of-the-art models for data stream mining, such as Hoeffding
trees, drift detectors or ensemble models. The results demonstrated the performance
improvement achieved with our proposal.
Time series forecasting is one of the most common statistical and machine
learning problems, covering all data with a temporal component, such as
meteorological, energy, medical, logistical or financial data. The emergence
of deep learning as the state-of-the-art in data mining has benefited research
related to time series forecasting. Therefore, we present the most comprehensive
experimental study on the applicability of deep learning for time series
forecasting. More than 50,000 time series were used for this study. We trained
and evaluated a total of 3,800 models of different architectures: multilayer
perceptron (MLP), Elman recurrent neural network (ERNN), long-short
term memory network (LSTM), gated recurrent unit network (GRU), echo
state network (ESN), convolutional neural network (CNN), temporal convolutional
network (TCN) and Transformer. The results of these experiments
show that the LSTM and CNN networks are the best alternatives. The LSTM
managed to obtain the most accurate predictions, while the CNN achieved
comparable performance with lower variability and lower computational cost.
The last contribution presented in this thesis aims to combine the two main topics, both time series forecasting and data stream mining, into a real
application such as solar irradiance forecasting. The climate and energy crisis
has accelerated the search for renewable energy sources, and solar energy in
particular as it is one of the most promising sources. For the management of
photovoltaic parks, it is necessary to carry out a correct load balancing, which
requires an accurate prediction of the solar irradiance in the short term. In
this work, we present a solution based on the ADLStream framework and
deep learning models to predict the solar irradiance of the PV sensors of a
streaming Canadian solar grid. The results obtained confirm the ideonality
of this solution, obtaining very accurate predictions and demonstrating a
great capacity to adapt to the evolution of the stream data. | es |
dc.format | application/pdf | es |
dc.format.extent | 201 p. | es |
dc.language.iso | spa | es |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Predicción de series temporales en streaming mediante Deep Learning | es |
dc.type | info:eu-repo/semantics/doctoralThesis | es |
dcterms.identifier | https://ror.org/03yxnpp24 | |
dc.type.version | info:eu-repo/semantics/publishedVersion | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
dc.contributor.affiliation | Universidad de Sevilla. Departamento de Lenguajes y Sistemas Informáticos | es |
dc.date.embargoEndDate | 2023-06-27 | |
dc.publication.endPage | 179 | es |