Publication:
Towards a Data-driven Approach for Agent-Based Modelling: Simulating Spanish Postmodernisation

Loading...
Thumbnail Image
Official URL
Full text at PDC
Publication Date
2017-10-04
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Complutense de Madrid
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
In the lasts decades, computer simulation in general, and agent based modelling (ABM) in particular, has become one of the mainstream modelling techniques in many scientific fields, especially in Social Sciences such as Sociology or Economics. Social simulation allows the study of the complexity inherent to social phenomena and it is attracting multidisciplinary research teams in order to manage this complexity.There are different methodologies for ABM that, after compiling experience in processes, methods and tools, attempt to provide a systematic way to tackle new problems. Both the Multi-Agent Systems field and ABM have tried to provide robust methodologies to guide researchers in the modelling process. However, there is an important epistemological distinction among agent-based models that these methodologies do not consider. Models can be classified depending on their research aim, and this classification can have methodological implications. Sometimes researchers seek a generic model to explain a social phenomena from a high degree of abstraction, and one that is simple enough to be used as an illustration of a specific theory or hypothesis. On the other hand, researchers may prefer to focus on the expressiveness of the model, together with the empirical descriptiveness of a specific case study. The first case corresponds to Theoretical Research, while the second one would be Data-driven Research. Nowadays, most of the models are conceived from the theoretical approach, and thus methodologies are frequently biased towards them. However, without disregarding the role of theory, models can also seek expressiveness. In order to do that, they may have needs that are not met in general methodologies. For instance, issues such as the empirical initialisation, the limitations of data collection, the throughout empirical validation or the role of data in the design are not usually considered in those methodologies. Thus, there is a lack of a complete ABM methodology that, assuming data-driven research has a different approach and aims, provides a specific flow of data-driven model development. Such methodology should consider the key role of empirical data throughout all the modelling stages. This lack has caused most data-driven models to be constructed without a common frame. This work attempts to fill this gap and build a complete methodology to guide data-driven agent-based modelling. Therefore, it can be advocated that when there are available data from the observation of the real phenomenon, the modelling and simulation process involves additional stages. This methodology attempts to guide the injection of empirical data into the simulation, bringing them closer to the real phenomenon under study, while acknowledging the important role of theory in the whole process. Therefore, the approach is complemented with a systematic method for the exploration of the model space in order to achieve comprehensible but descriptive models. Such a method was coined `Deepening KISS’, as it is exposed in the methodological chapter. This methodology is supported technically by the specification and implementation of a social agent framework. Such framework is structured in modules which can be enabled at will in order to facilitate the exploration of the model space and its incremental construction, both in the frame of the data-driven approach. Instead of attempting to build a general-purpose framework, this agent framework focuses on a family of problems which can be best tackled within it. Moreover, an in-depth case study was developed to test and validate the application of the methodology and proposed framework. This case study addresses the complex issue of social values evolution, together with the friendship emergence and the demographic dynamics involved. The construction of this agent-based model, coined Mentat, can be summarised in a series of key milestones. The proposed data-driven methodology is applied intensively through the course of its development. The modelling process has been realised as (a) bottom-up and (b) top-down. (a) is represented by the social network arising from the micro behaviour and friendship dynamics. (b) relies on the elaborated demographic model. The conceptualisation and specification of (a) and (b) has been justified theoretically in order to support its development. They have been implemented within the modular agent framework, designed in incremental layers. Mentat features are structured in modules which can be enabled or disabled in order to explore the model space following the stages defined in the methodology. The model is validated from a quantitative macro perspective (empirical validation), from a qualitative micro perspective (social dynamics matching the theoretical assumptions) and from a theoretical perspective (discussing its sociological consistency). Different techniques of Artificial Intelligence are applied and combined in the model, testing the framework adaptability and their use for social simulation. Mentat serves as a case study of the methodology and framework, but it also provides some sociological insight of the problem under study, by giving new support to specific theories. The ABM specifically stresses the key significance of demographic dynamics in the case study: the evolution of social values in Spain during the end of 20th Century. This implies that intergenerational changes are considerably more important than intragenerational ones in this Spanish context, and supports Inglehart’s theories of values evolution.
Durante las últimas décadas, la simulación computacional y el modelado basado en agentes (agent-based modelling, ABM) en particular, se han convertido en una de las principales tecnologías de modelado en múltiples campos científicos, especialmente en ciencias sociales como la sociología y la economía. La simulación social permite el estudio de la complejidad propia de los fenómenos sociales, y está atrayendo equipos de investigación multidisciplinares para poder manejar dicha complejidad. Existen distintas metodologías para ABM que, después de compilar suficiente experiencia en procesos, métodos y herramientas, ofrecen una forma sistemática para estudiar problemas nuevos. Tanto el campo de Sistemas Multi-Agente como el de ABM han tratado de ofrecer metodologías robustas que puedan guiar a los investigadores en el proceso de modelado. Sin embargo, hay una distinción epistemológica importante entre los modelos basados en agentes que tiene implicaciones metodológicas y que dichas metodologías no consideran. Los modelos pueden ser clasificados en función de su objetivo de investigación. En ocasiones, el investigador persigue un modelo genérico para explicar el fenómeno social, desde un alto grado de abstracción y de forma suficientemente simplificada para ilustrar fácilmente una teoría o hipótesis concreta. Por otro lado, el investigador puede preferir centrarse en la expresividad del modelo, en la que se haga una extensa descripción empírica de un caso de estudio concreto. El primer caso corresponde a la llamada ``investigación dirigida por teoría'', mientras que la segunda es la ``investigación dirigida por datos''. Hoy día, la mayor parte de los modelos son concebidos desde el punto de vista de la investigación dirigida por la teoría, y por ello las metodologías sueles estar sesgadas hacia ese enfoque. Sin embargo, y sin ignorar el importante papel de la teoría, los modelos pueden buscar principalmente expresividad y descripción. Y para ello, pueden tener requisitos que no son abordados por dichas metodologías genéricas. Por ejemplo, temas como la inicialización empírica, las limitaciones de la recolección de datos, la validación empírica intensiva, o el papel de los datos en el diseño no son considerados normalmente en estas metodologías. Así, existe una carencia de una completa metodología en ABM que, asumiendo que la investigación dirigida por datos tiene un enfoque y objetivos sensiblemente distintos, ofrezca el flujo de desarrollo de modelos dirigidos por datos. Esta metodología debería considerar el papel clave de los datos empíricos a lo largo de las fases de modelado. Esta carencia ha provocado que los modelos dirigidos por datos existentes hayan sido construidos sin un marco común. Este trabajo pretende cubrir ese vacío y construir una metodología completa para guiar el modelado basado en agentes dirigido por datos (data-driven ABM). Así, puede afirmarse que cuando existen datos empíricos disponibles de la observación del caso de estudio, el proceso de modelado y simulación implica nuevas fases. Esta metodología pretende guiar la introducción de datos empíricos en la simulación, acercándola al fenómeno real, pero reconociendo el papel fundamental de la teoría en todo el proceso. Este enfoque es complementado con un método sistemático de exploración del espacio de modelos para obtener modelos comprensibles pero a la vez descriptivos. Este método ha sido denominado ``Deepening KISS'' (``Profundizando en el KISS\footnote{KISS es el acrónimo de ``Keep It Simple, Stupid'', es decir, ``Mantenlo simple, estúpido'', principio equivalente a la navaja de Occam que aboga por la simplicidad como objetivo por sí sólo.}'') y es explicado en profundidad en el capítulo metodológico. Esta metodología es apoyada técnicamente por la especificación e implementación de un framework de agentes sociales. Este framework está estructurado en módulos que pueden ser activados a voluntad, para facilitar la exploración del espacio de modelos y su construcción incremental, ambos en el marco del enfoque dirigido por datos. En lugar de tratar de construir un framework para uso general, éste se centra en una familia de problemas que puede abordar cómodamente. Además, se ha desarrollado en profundidad un caso de estudio para probar y validar la aplicación de esta metodología en el marco del framework propuesto. Este caso de estudio se enfrenta al problema de la evolución de valores sociales, junto con los procesos simultáneos de emergencia de la amistad y dinámicas demográficas asociadas. La construcción de este modelo basado en agentes, denominado Mentat, puede ser resumido en una serie de aspectos. La metodología dirigida por datos propuesta es aplicada intensamente a lo largo de su desarrollo. El proceso de modelado ha sido realizado (a) bottom-up y (b) top-down. (a) es representado por la red social que surge del comportamiento micro y las dinámicas de amistad. (b) se sostiene en el elaborado modelo demográfico. Todo ello ha sido implementado en el marco del framework de agentes, diseñado de forma modular y en capas incrementales. Las capacidades de Mentat han sido estructuradas en módules desactivables para poder explorar distintas combinaciones de modelos, siguiendo con la metodología definida. El modelo es validado desde un enfoque macro cuantitativo (validación empírica), desde un enfoque micro cualitativo (correspondencia de la dinámica social con los supuestos teóricos) y desde el enfoque teórico (discutiendo su consistencia sociológica). Además, distintas tecnologías de Inteligencia Artificial han sido incorporadas al modelo, probando la adaptabilidad del framework y la utilidad de éstas en simulación social. Mentat ha servido de caso de estudio para la metodología y el framework, pero a su vez ofrece un alto grado de comprensión sobre el problema, otorgando nuevo apoyo a determinadas teorías sociológicas. En concreto, este modelo enfatiza la importancia de la dinámica demográfica en el caso de estudio elegido: la evolución de valores sociales en la España de fin de siglo. Esto implica que los cambios intergeneracionales son considerablemente más importantes que los intrageneracionales, al menos en el contexto español, reforzando así las teorías de Ronald Inglehart al respecto.
Description
Licensed under a Creative Commons Attribution 3.0 International: http://creativecommons.org/licenses/by/3.0/ Tesis inédita de la Universidad Complutense de Madrid, Facultad de Informática, Departamento de Ingeniería del Software e Inteligencia Artificial, leída el 19-01-2010
Keywords
Citation
Collections