Publication: Towards a Data-driven Approach for Agent-Based Modelling: Simulating Spanish Postmodernisation
Loading...
Files
Official URL
Full text at PDC
Publication Date
2017-10-04
Authors
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Complutense de Madrid
Abstract
In the lasts decades, computer simulation in general, and agent based modelling (ABM) in particular, has become one of the mainstream modelling techniques in many scientific fields, especially in Social Sciences such as Sociology or Economics. Social simulation allows the study of the complexity inherent to social phenomena and it is attracting multidisciplinary research teams in order to manage this complexity.There are different methodologies for ABM that, after compiling experience in processes, methods and tools, attempt to provide a systematic way to tackle new problems. Both the Multi-Agent Systems field and ABM have tried to provide robust methodologies to guide researchers in the modelling process.
However, there is an important epistemological distinction among agent-based models that these methodologies do not consider. Models can be classified depending on their research aim, and this classification can have methodological implications. Sometimes researchers seek a generic model to explain a social phenomena from a high degree of abstraction, and one that is simple enough to be used as an illustration of a specific theory or hypothesis. On the other hand, researchers may prefer to focus on the expressiveness of the model, together with the empirical descriptiveness of a specific case study. The first case corresponds to Theoretical Research, while the second one would be Data-driven Research.
Nowadays, most of the models are conceived from the theoretical approach, and thus methodologies are frequently biased towards them. However, without disregarding the role of theory, models can also seek expressiveness. In order to do that, they may have needs that are not met in general methodologies. For instance, issues such as the empirical initialisation, the limitations of data collection, the throughout empirical validation or the role of data in the design are not usually considered in those methodologies. Thus, there is a lack of a complete ABM methodology that, assuming data-driven research has a different approach and aims, provides a specific flow of data-driven model development. Such methodology should consider the key role of empirical data throughout all the modelling stages. This lack has caused most data-driven models to be constructed without a common frame.
This work attempts to fill this gap and build a complete methodology to guide data-driven agent-based modelling. Therefore, it can be advocated that when there are available data from the observation of the real phenomenon, the modelling and simulation process involves additional stages. This methodology attempts to guide the injection of empirical data into the simulation, bringing them closer to the real phenomenon under study, while acknowledging the important role of theory in the whole process. Therefore, the approach is complemented with a systematic method for the exploration of the model space in order to achieve comprehensible but descriptive models. Such a method was coined `Deepening KISS’, as it is exposed in the methodological chapter.
This methodology is supported technically by the specification and implementation of a social agent framework. Such framework is structured in modules which can be enabled at will in order to facilitate the exploration of the model space and its incremental construction, both in the frame of the data-driven approach. Instead of attempting to build a general-purpose framework, this agent framework focuses on a family of problems which can be best tackled within it.
Moreover, an in-depth case study was developed to test and validate the application of the methodology and proposed framework. This case study addresses the complex issue of social values evolution, together with the friendship emergence and the demographic dynamics involved.
The construction of this agent-based model, coined Mentat, can be summarised in a series of key milestones. The proposed data-driven methodology is applied intensively through the course of its development. The modelling process has been realised as (a) bottom-up and (b) top-down. (a) is represented by the social network arising from the micro behaviour and friendship dynamics. (b) relies on the elaborated demographic model. The conceptualisation and specification of (a) and (b) has been justified theoretically in order to support its development. They have been implemented within the modular agent framework, designed in incremental layers. Mentat features are structured in modules which can be enabled or disabled in order to explore the model space following the stages defined in the methodology. The model is validated from a quantitative macro perspective (empirical validation), from a qualitative micro perspective (social dynamics matching the theoretical assumptions) and from a theoretical perspective (discussing its sociological consistency). Different techniques of Artificial Intelligence are applied and combined in the model, testing the framework adaptability and their use for social simulation. Mentat serves as a case study of the methodology and framework, but it also provides some sociological insight of the problem under study, by giving new support to specific theories. The ABM specifically stresses the key significance of demographic dynamics in the case study: the evolution of social values in Spain during the end of 20th Century. This implies that intergenerational changes are considerably more important than intragenerational ones in this Spanish context, and supports Inglehart’s theories of values evolution.
Durante las Ăşltimas dĂ©cadas, la simulaciĂłn computacional y el modelado basado en agentes (agent-based modelling, ABM) en particular, se han convertido en una de las principales tecnologĂas de modelado en mĂşltiples campos cientĂficos, especialmente en ciencias sociales como la sociologĂa y la economĂa. La simulaciĂłn social permite el estudio de la complejidad propia de los fenĂłmenos sociales, y está atrayendo equipos de investigaciĂłn multidisciplinares para poder manejar dicha complejidad. Existen distintas metodologĂas para ABM que, despuĂ©s de compilar suficiente experiencia en procesos, mĂ©todos y herramientas, ofrecen una forma sistemática para estudiar problemas nuevos. Tanto el campo de Sistemas Multi-Agente como el de ABM han tratado de ofrecer metodologĂas robustas que puedan guiar a los investigadores en el proceso de modelado. Sin embargo, hay una distinciĂłn epistemolĂłgica importante entre los modelos basados en agentes que tiene implicaciones metodolĂłgicas y que dichas metodologĂas no consideran. Los modelos pueden ser clasificados en funciĂłn de su objetivo de investigaciĂłn. En ocasiones, el investigador persigue un modelo genĂ©rico para explicar el fenĂłmeno social, desde un alto grado de abstracciĂłn y de forma suficientemente simplificada para ilustrar fácilmente una teorĂa o hipĂłtesis concreta. Por otro lado, el investigador puede preferir centrarse en la expresividad del modelo, en la que se haga una extensa descripciĂłn empĂrica de un caso de estudio concreto. El primer caso corresponde a la llamada ``investigaciĂłn dirigida por teorĂa'', mientras que la segunda es la ``investigaciĂłn dirigida por datos''. Hoy dĂa, la mayor parte de los modelos son concebidos desde el punto de vista de la investigaciĂłn dirigida por la teorĂa, y por ello las metodologĂas sueles estar sesgadas hacia ese enfoque. Sin embargo, y sin ignorar el importante papel de la teorĂa, los modelos pueden buscar principalmente expresividad y descripciĂłn. Y para ello, pueden tener requisitos que no son abordados por dichas metodologĂas genĂ©ricas. Por ejemplo, temas como la inicializaciĂłn empĂrica, las limitaciones de la recolecciĂłn de datos, la validaciĂłn empĂrica intensiva, o el papel de los datos en el diseño no son considerados normalmente en estas metodologĂas. AsĂ, existe una carencia de una completa metodologĂa en ABM que, asumiendo que la investigaciĂłn dirigida por datos tiene un enfoque y objetivos sensiblemente distintos, ofrezca el flujo de desarrollo de modelos dirigidos por datos. Esta metodologĂa deberĂa considerar el papel clave de los datos empĂricos a lo largo de las fases de modelado. Esta carencia ha provocado que los modelos dirigidos por datos existentes hayan sido construidos sin un marco comĂşn. Este trabajo pretende cubrir ese vacĂo y construir una metodologĂa completa para guiar el modelado basado en agentes dirigido por datos (data-driven ABM). AsĂ, puede afirmarse que cuando existen datos empĂricos disponibles de la observaciĂłn del caso de estudio, el proceso de modelado y simulaciĂłn implica nuevas fases. Esta metodologĂa pretende guiar la introducciĂłn de datos empĂricos en la simulaciĂłn, acercándola al fenĂłmeno real, pero reconociendo el papel fundamental de la teorĂa en todo el proceso. Este enfoque es complementado con un mĂ©todo sistemático de exploraciĂłn del espacio de modelos para obtener modelos comprensibles pero a la vez descriptivos. Este mĂ©todo ha sido denominado ``Deepening KISS'' (``Profundizando en el KISS\footnote{KISS es el acrĂłnimo de ``Keep It Simple, Stupid'', es decir, ``Mantenlo simple, estĂşpido'', principio equivalente a la navaja de Occam que aboga por la simplicidad como objetivo por sĂ sĂłlo.}'') y es explicado en profundidad en el capĂtulo metodolĂłgico. Esta metodologĂa es apoyada tĂ©cnicamente por la especificaciĂłn e implementaciĂłn de un framework de agentes sociales. Este framework está estructurado en mĂłdulos que pueden ser activados a voluntad, para facilitar la exploraciĂłn del espacio de modelos y su construcciĂłn incremental, ambos en el marco del enfoque dirigido por datos. En lugar de tratar de construir un framework para uso general, Ă©ste se centra en una familia de problemas que puede abordar cĂłmodamente. Además, se ha desarrollado en profundidad un caso de estudio para probar y validar la aplicaciĂłn de esta metodologĂa en el marco del framework propuesto. Este caso de estudio se enfrenta al problema de la evoluciĂłn de valores sociales, junto con los procesos simultáneos de emergencia de la amistad y dinámicas demográficas asociadas. La construcciĂłn de este modelo basado en agentes, denominado Mentat, puede ser resumido en una serie de aspectos. La metodologĂa dirigida por datos propuesta es aplicada intensamente a lo largo de su desarrollo. El proceso de modelado ha sido realizado (a) bottom-up y (b) top-down. (a) es representado por la red social que surge del comportamiento micro y las dinámicas de amistad. (b) se sostiene en el elaborado modelo demográfico. Todo ello ha sido implementado en el marco del framework de agentes, diseñado de forma modular y en capas incrementales. Las capacidades de Mentat han sido estructuradas en mĂłdules desactivables para poder explorar distintas combinaciones de modelos, siguiendo con la metodologĂa definida. El modelo es validado desde un enfoque macro cuantitativo (validaciĂłn empĂrica), desde un enfoque micro cualitativo (correspondencia de la dinámica social con los supuestos teĂłricos) y desde el enfoque teĂłrico (discutiendo su consistencia sociolĂłgica). Además, distintas tecnologĂas de Inteligencia Artificial han sido incorporadas al modelo, probando la adaptabilidad del framework y la utilidad de Ă©stas en simulaciĂłn social. Mentat ha servido de caso de estudio para la metodologĂa y el framework, pero a su vez ofrece un alto grado de comprensiĂłn sobre el problema, otorgando nuevo apoyo a determinadas teorĂas sociolĂłgicas. En concreto, este modelo enfatiza la importancia de la dinámica demográfica en el caso de estudio elegido: la evoluciĂłn de valores sociales en la España de fin de siglo. Esto implica que los cambios intergeneracionales son considerablemente más importantes que los intrageneracionales, al menos en el contexto español, reforzando asĂ las teorĂas de Ronald Inglehart al respecto.
Durante las Ăşltimas dĂ©cadas, la simulaciĂłn computacional y el modelado basado en agentes (agent-based modelling, ABM) en particular, se han convertido en una de las principales tecnologĂas de modelado en mĂşltiples campos cientĂficos, especialmente en ciencias sociales como la sociologĂa y la economĂa. La simulaciĂłn social permite el estudio de la complejidad propia de los fenĂłmenos sociales, y está atrayendo equipos de investigaciĂłn multidisciplinares para poder manejar dicha complejidad. Existen distintas metodologĂas para ABM que, despuĂ©s de compilar suficiente experiencia en procesos, mĂ©todos y herramientas, ofrecen una forma sistemática para estudiar problemas nuevos. Tanto el campo de Sistemas Multi-Agente como el de ABM han tratado de ofrecer metodologĂas robustas que puedan guiar a los investigadores en el proceso de modelado. Sin embargo, hay una distinciĂłn epistemolĂłgica importante entre los modelos basados en agentes que tiene implicaciones metodolĂłgicas y que dichas metodologĂas no consideran. Los modelos pueden ser clasificados en funciĂłn de su objetivo de investigaciĂłn. En ocasiones, el investigador persigue un modelo genĂ©rico para explicar el fenĂłmeno social, desde un alto grado de abstracciĂłn y de forma suficientemente simplificada para ilustrar fácilmente una teorĂa o hipĂłtesis concreta. Por otro lado, el investigador puede preferir centrarse en la expresividad del modelo, en la que se haga una extensa descripciĂłn empĂrica de un caso de estudio concreto. El primer caso corresponde a la llamada ``investigaciĂłn dirigida por teorĂa'', mientras que la segunda es la ``investigaciĂłn dirigida por datos''. Hoy dĂa, la mayor parte de los modelos son concebidos desde el punto de vista de la investigaciĂłn dirigida por la teorĂa, y por ello las metodologĂas sueles estar sesgadas hacia ese enfoque. Sin embargo, y sin ignorar el importante papel de la teorĂa, los modelos pueden buscar principalmente expresividad y descripciĂłn. Y para ello, pueden tener requisitos que no son abordados por dichas metodologĂas genĂ©ricas. Por ejemplo, temas como la inicializaciĂłn empĂrica, las limitaciones de la recolecciĂłn de datos, la validaciĂłn empĂrica intensiva, o el papel de los datos en el diseño no son considerados normalmente en estas metodologĂas. AsĂ, existe una carencia de una completa metodologĂa en ABM que, asumiendo que la investigaciĂłn dirigida por datos tiene un enfoque y objetivos sensiblemente distintos, ofrezca el flujo de desarrollo de modelos dirigidos por datos. Esta metodologĂa deberĂa considerar el papel clave de los datos empĂricos a lo largo de las fases de modelado. Esta carencia ha provocado que los modelos dirigidos por datos existentes hayan sido construidos sin un marco comĂşn. Este trabajo pretende cubrir ese vacĂo y construir una metodologĂa completa para guiar el modelado basado en agentes dirigido por datos (data-driven ABM). AsĂ, puede afirmarse que cuando existen datos empĂricos disponibles de la observaciĂłn del caso de estudio, el proceso de modelado y simulaciĂłn implica nuevas fases. Esta metodologĂa pretende guiar la introducciĂłn de datos empĂricos en la simulaciĂłn, acercándola al fenĂłmeno real, pero reconociendo el papel fundamental de la teorĂa en todo el proceso. Este enfoque es complementado con un mĂ©todo sistemático de exploraciĂłn del espacio de modelos para obtener modelos comprensibles pero a la vez descriptivos. Este mĂ©todo ha sido denominado ``Deepening KISS'' (``Profundizando en el KISS\footnote{KISS es el acrĂłnimo de ``Keep It Simple, Stupid'', es decir, ``Mantenlo simple, estĂşpido'', principio equivalente a la navaja de Occam que aboga por la simplicidad como objetivo por sĂ sĂłlo.}'') y es explicado en profundidad en el capĂtulo metodolĂłgico. Esta metodologĂa es apoyada tĂ©cnicamente por la especificaciĂłn e implementaciĂłn de un framework de agentes sociales. Este framework está estructurado en mĂłdulos que pueden ser activados a voluntad, para facilitar la exploraciĂłn del espacio de modelos y su construcciĂłn incremental, ambos en el marco del enfoque dirigido por datos. En lugar de tratar de construir un framework para uso general, Ă©ste se centra en una familia de problemas que puede abordar cĂłmodamente. Además, se ha desarrollado en profundidad un caso de estudio para probar y validar la aplicaciĂłn de esta metodologĂa en el marco del framework propuesto. Este caso de estudio se enfrenta al problema de la evoluciĂłn de valores sociales, junto con los procesos simultáneos de emergencia de la amistad y dinámicas demográficas asociadas. La construcciĂłn de este modelo basado en agentes, denominado Mentat, puede ser resumido en una serie de aspectos. La metodologĂa dirigida por datos propuesta es aplicada intensamente a lo largo de su desarrollo. El proceso de modelado ha sido realizado (a) bottom-up y (b) top-down. (a) es representado por la red social que surge del comportamiento micro y las dinámicas de amistad. (b) se sostiene en el elaborado modelo demográfico. Todo ello ha sido implementado en el marco del framework de agentes, diseñado de forma modular y en capas incrementales. Las capacidades de Mentat han sido estructuradas en mĂłdules desactivables para poder explorar distintas combinaciones de modelos, siguiendo con la metodologĂa definida. El modelo es validado desde un enfoque macro cuantitativo (validaciĂłn empĂrica), desde un enfoque micro cualitativo (correspondencia de la dinámica social con los supuestos teĂłricos) y desde el enfoque teĂłrico (discutiendo su consistencia sociolĂłgica). Además, distintas tecnologĂas de Inteligencia Artificial han sido incorporadas al modelo, probando la adaptabilidad del framework y la utilidad de Ă©stas en simulaciĂłn social. Mentat ha servido de caso de estudio para la metodologĂa y el framework, pero a su vez ofrece un alto grado de comprensiĂłn sobre el problema, otorgando nuevo apoyo a determinadas teorĂas sociolĂłgicas. En concreto, este modelo enfatiza la importancia de la dinámica demográfica en el caso de estudio elegido: la evoluciĂłn de valores sociales en la España de fin de siglo. Esto implica que los cambios intergeneracionales son considerablemente más importantes que los intrageneracionales, al menos en el contexto español, reforzando asĂ las teorĂas de Ronald Inglehart al respecto.
Description
Licensed under a Creative Commons Attribution 3.0 International: http://creativecommons.org/licenses/by/3.0/
Tesis inĂ©dita de la Universidad Complutense de Madrid, Facultad de Informática, Departamento de IngenierĂa del Software e Inteligencia Artificial, leĂda el 19-01-2010