María Inmaculada Rodríguez García
Predecir la calidad del aire es una tarea muy importante ya que se sabe que tiene un impacto significativo en la salud. La Bahía de Algeciras (España) es una zona altamente industrializada con uno de los mayores puertos de Europa. Durante el periodo 2010-2019, se registraron diferentes datos en las estaciones de monitorización de la Bahía, formando una base de datos de 131 variables de concentraciones de contaminantes atmosféricos, de información meteorológica y datos de tonelada-buque de barcos en la Bahía de Algeciras.
En esta tesis se desarrolló un análisis en tres fases. La primera fase consistió en un diagnóstico de la calidad del aire, la segunda en una estimación-predicción de la calidad del aire y la tercera en una predicción de la calidad del aire.
En la primera fase, el primer paso fue desarrollar un análisis en profundidad realizado durante los años 2010 a 2015 del alcance de la contaminación atmosférica en las dos principales ciudades y más pobladas de la Bahía de Algeciras (Algeciras y La Línea). Es una zona donde coexisten varios grandes focos de contaminación atmosférica como varias industrias químicas y carreteras. Además, el puerto de Algeciras es uno de los más importantes de Europa, y la ciudad de La Línea está afectada por el aeropuerto de Gibraltar, lo que contribuye al aumento de la contaminación en el Estrecho de Gibraltar. Se ha desarrollado un completo análisis estadístico para conocer aspectos relevantes de la contaminación atmosférica en este escenario concreto. Por un lado, los valores medios de concentración más elevados se obtuvieron en Algeciras para NO2 (28,850 ¿g/m3) y en La Línea para SO2 (11,966 ¿g/m3) y PM10 (30,745 ¿g/m3). El análisis mostró patrones que coinciden con la actividad humana. Por otra parte, se desarrolló un cálculo de riesgos relativos que mostró que la humedad relativa, la velocidad del viento y la dirección del viento producen un aumento del riesgo de mayores concentraciones de contaminantes. Además, los resultados obtenidos mostraron que la velocidad y la dirección del viento son las variables más importantes en la distribución de partículas.
En la segunda fase, el objetivo era obtener predicciones fiables de las concentraciones de contaminantes relacionados con el tráfico marítimo (SO2, PM10, NO2, NOX y, NO) durante los años 2017 a 2019. Se analizaron tres escenarios diferentes de la Bahía de Algeciras que fueron las localizaciones del Parque de los Alcornocales, así como las ciudades de La Línea y Algeciras. Estos escenarios permitieron comparar los resultados entre ellos. El objetivo fue predecir los niveles futuros de calidad del aire de los principales contaminantes relacionados con el tráfico marítimo en la Bahía de Algeciras en función del resto de contaminantes, las variables meteorológicas y, una base de datos de buques. Se diseñó un procedimiento de remuestreo aleatorio utilizando un procedimiento de 5-CV (5-validación cruzada) y 20 repeticiones en cada experimento para asegurar la capacidad de generalización de los modelos probados, para calcular las predicciones de contaminantes con diferentes modelos de clasificación (incluyendo árboles de decisión, máquinas de soporte vectorial, ensembles, entre otros) y también con redes neuronales artificiales (RNAs) utilizando diferentes números de capas y unidades ocultas. El procedimiento propuesto de remuestreo aleatorio permite realizar comparaciones múltiples adecuadas y robustas de los modelos y permitió seleccionar un grupo de los mejores modelos de predicción. Los modelos se compararon utilizando varios índices de calidad de la clasificación, como la sensibilidad, la especificidad, la exactitud y la precisión. También se utilizó la distancia (d1) al clasificador perfecto (1, 1, 1, 1) como característica discriminante, para seleccionar los mejores modelos. Además, se realizó un análisis de relevancia para conocer qué variables son las más importantes para cada contaminante y se diseñaron modelos con menor número de entradas en una red de monitorización más óptima. Las sensibilidades obtenidas en los mejores modelos fueron de 0,98 para SO2, 0,97 para PM10, 0,82 para NO2 y NOX, y 0,83 para NO. Los resultados obtenidos demuestran el potencial de los modelos para predecir la contaminación en una ciudad portuaria o en un escenario de contaminación atmosférica complejo.
En la tercera fase, se predijeron los datos disponibles durante los años 2017 a 2019 en la estación de Algeciras utilizando modelos de Long-Short Term Memory (LSTM). Se desarrollaron cuatro enfoques diferentes para realizar previsiones de SO2 y NO2 a 1 hora y a 4 horas en Algeciras. El primero utiliza las 130 variables exógenas restantes. El segundo utiliza únicamente los datos de series temporales sin variables exógenas. El tercer enfoque consiste en utilizar un arreglo de series temporales autorregresivas como entrada y el cuarto es similar utilizando las series temporales junto con datos de viento y barcos. Los resultados mostraron que el SO2 se predice mejor con información autorregresiva y el NO2 se predice mejor con series temporales autorregresivas de barcos y viento, lo que indica que el NO2 está estrechamente relacionado con los motores de combustión y puede predecirse mejor.
Uno de los objetivos de esta tesis doctoral es desarrollar un sensor virtual útil capaz de conseguir una red de vigilancia más robusta, que pueda utilizarse en caso de datos faltantes. Además, puede servir como sistema de apoyo a la toma de decisiones por parte de las autoridades, que podría ser utilizado por los ciudadanos para prevenir la exposición a contaminantes y por las empresas para tomar decisiones sobre la calidad del aire.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados