Resumen de Aproximación de soluciones multimodales para aplicaciones Deep Learning

Ayuda

Resumen de Aproximación de soluciones multimodales para aplicaciones Deep Learning

Javier Ortega Bastida

Las oficinas de estadísticas de todo el mundo normalmente calculan y publican las estimaciones oficiales de indicadores macroeconómicos, como el Producto Interior Bruto (PIB), solo a nivel nacional y con una periodicidad anual. En algunos países se pueden encontrar también datos oficiales con frecuencias menores, como semestrales o trimestrales, y, en ocasiones, a niveles geográficos inferiores, aunque este último caso es menos común y cuando se publica suele realizarse únicamente con carácter anual. En países como España, el PIB nacional se comunica oficialmente con una regularidad trimestral, sin embargo, el PIB a nivel regional solamente se publica anualmente. Además de estos indicadores, no existen otras estimaciones oficiales, ya que por ejemplo no es posible conocer el PIB para zonas geográficas de niveles inferiores, como ciudades o provincias, o con periodicidades distintas. Sin embargo, para la actividad política y financiera resulta de gran interés conocer la evolución económica en frecuencias menores a un año o trimestre, ya que esto resulta en ocasiones decisivo para la toma de decisiones. De igual forma, conocer esta información para unidades geográficas más específicas, permitiría a los actores económicos potenciar sus inversiones y evitar las zonas de mayor riesgo. Esta disertación propone un enfoque multimodal basado en aprendizaje automático para la predicción del PIB a niveles geográficos distintos al nacional y con frecuencias temporales inferiores a la anual. La aproximación propuesta combina diferentes fuentes de información, como valores históricos y mensajes escritos en la red social Twitter. Para esto, se realiza un estudio exhaustivo donde distintas soluciones y metodologías son evaluadas para comparar su precisión frente a otras propuestas existentes, incluyendo técnicas de aprendizaje supervisado y no supervisado, de procesamiento del lenguaje natural y de análisis de secuencias. La multimodalidad permite mejorar la precisión de un modelo predictivo gracias a su capacidad de combinar información almacenada en distintas fuentes de datos (como son en nuestro caso los valores históricos del PIB y la información textual de los tweets). En un primer estudio sobre técnicas de multimodalidad analizaremos su aplicación a un entorno interactivo para el reconocimiento de objetos, donde imágenes y metadatos textuales y numéricos serán combinados. En base a las conclusiones extraídas de este estudio preliminar, se propuso una solución para la predicción del PIB regional a partir de la información económica extraída y filtrada de la red social Twitter. Esta solución se extendió posteriormente para combinar la información con valores históricos y, de esta forma, mejorar la precisión de las predicciones. Además, esta aproximación también nos permitió determinar las opiniones más y menos influyentes a la hora de realizar una predicción. Los resultados obtenidos se compararon con otros trabajos del estado del arte, demostrando una precisión superior al estimar la tendencia del valor del PIB. Además, se evaluó la validez de la propuesta para frecuencias temporales trimestrales y semanales, y para la predicción en distintas comunidades autónomas, incluyendo casos uniprovinciales y pluriprovinciales. Por último, y dadas las circunstancias en las que este estudio se realizó, el método propuesto fue evaluado en un entorno real condicionado por la pandemia de la COVID-19. Esto nos permitió analizar la capacidad del método en una situación extrema, en la que el desplome del PIB fue el mayor en casi un siglo, obteniendo unos resultados prometedores que no se podrían haber conseguido sin la combinación de diferentes fuentes de información.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Mi Documat

Selección

Coordinado por: