Ir al contenido

Documat


Resumen de Forecasting SARS-CoV-2 in the peruvian regions: a deep learning approach using temporal convolutional neural networks

Luis Aguilar, Miguel Ibáñez Reluz, Juan C. Z. Aguilar, Elí W. Zavaleta Aguilar, L. Antonio Aguilar

  • español

    La pandemia SARS-CoV-2 ha tomado al mundo por sorpresa desde su descubrimiento en Diciembre del 2019, causando elevadas pérdidas en todo el mundo. En este trabajo, se desarrolló un modelo de aprendizaje profundo para predecir y pronosticar los casos diarios de SARS-CoV-2 en las regiones peruanas. Los datos utilizados pertenecen al conjunto de datos abierto covid-19, proporciondo por el Ministerio de Salud del Perú (MINSA). El conjunto de datos incluye los períodos desde el 03 de Marzo del 2020 hasta el 16 de Marzo del 2021. Se utilizó un enfoque de exclusión, creando datos de entranamiento y validación.

    Utilizando el conjunto de validación, se desarrolló una red neuronal convolucional temporal (TCN) con cinco capas de profundidad. El modelo se diseño para predecir la tendencia promedio junto con intervalos de predicción. Para encontrar la mejor configuración de hiperparámetros, se aplicó un enfoque bayesiano sobre el conjunto de validación. El modelo TCN se entrenó utilizando la configuración óptima. Una vez entrenado, el modelo fue capaz de predecir las diferentes tendecias de SARS-CoV-2 presentes en las regiones.

    A continuación, se realizó un pronóstico más allá de los datos disponibles, usando una ventana de 15 dias de adelanto (Marzo 17 a Marzo 31, 2021) para cada región. Resultados del pronóstico sugieren una tendencia sostenida para todas las regiones, con excepción de Lima. La performance del modelo fue evaluada usando las metricas MAE, MAD, MSLE y RMSLE, en el periodo de test, mostrando mejoras de métricas del entrenamiento para la validación del 14.534, 3.123, 0.042, 0.047 respectivamente.

     

  • English

    The SARS-CoV-2 pandemic had taken the world by surprise since its discovery on December 2019, causing major losses worldwide. In this work, a deep learning model was developed to predict and forecast the daily SARS-CoV-2 cases on the Peruvian regions. The data used belongs to the open covid–19 data set, sourced by the Health Ministry of Peru (MINSA). The data set includes the periods from March 03, 2020 to March 16, 2021. A holdout approach was used, creating a training and validation data splits. Using the validation set, a temporal convolution neural network (TCN) composed by five layers was developed. The model was design to predict a mean tendency alongside with a prediction interval. To find the best hyper parameter configuration, a Bayesian approach was applied over the validation set. The TCN model was trained using the optimal configuration. Once trained, the model was able to predict the different SARS-CoV-2 trends present in the regions. Next, a forecast was performed beyond the available data, using a window of 15 days ahead (March 17 to March 31, 2021) for each region. Forecast results suggested a continued trend for all the regions, except Lima. The model performance was evaluated using the MAE, MAD, MSLE and RMSLE metrics on the test period, showing training to validation metrics improvements of 14.534, 3.123, 0.042, 0.047 respectively.


Fundación Dialnet

Mi Documat