Ir al contenido

Documat


Resumen de Estructuras estocásticas notables en procesos puntuales espacio-temporales y medidas de riesgo bivariantes

Amalia Isabel Escudero Villa

  • español

    La modelización estadística constituye un conjunto de formulaciones matemáticas que proporcionan un mejor entendimiento de los fenómenos, especialmente en los que subyacen relaciones entre variables que a su vez poseen influencia aleatoria. En este trabajo de tesis se realiza la modelización estadística del fenómeno delictivo, mediante el desarrollo de estructuras estocásticas en procesos puntuales espacio-temporales, con el propósito de reproducir eventos de la forma más exacta posible a la realidad en función de su evolución en el espacio, tiempo y espacio-tiempo. En primer lugar, se estructura la dependencia espacio-temporal de los procesos auto-excitados espacialmente correlacionados, considerando una ecuación en diferencias estocástica para la intensidad del proceso espacio-temporal, que captura tanto la dependencia debida a la auto-excitación como la dependencia en un proceso espacial subyacente. Se sigue el razonamiento de Clark y Dixon (2021) y Reinhart (2018), pero capturando la no linealidad de las covariables espacio-temporales mediante una estructura aditiva generalizada (GAM) con B-splines. En segundo lugar, se estructura un modelo de proceso espacio-temporal latente, es decir, un procesos de Cox log-gaussiano (LGCP), con una función de intensidad separable de primer orden. La componente determinista temporal es el resultado de un modelo lineal generalizado (GLM) con efectos de covariables meteorológicas, días y meses del año, parámetros de regresión armónica, periodicidad anual de las tasas de incidencia y tendencia global. Para la componente determinista espacial se considera un GAM siguiendo el razonamiento de Diggle et al. (2005), Taylor et al. (2013) y González y Mateu (2021), pero con estimación de suavidad integrada con B-splines univariantes. Por su parte, para la componente estocástica, se considera un campo gaussiano que modeliza la dependencia y la variación espacio-temporal de los eventos. En tercer lugar, se identifican los mecanismos de auto-excitación entre las series de delitos en un tiempo continuo mediante los procesos puntuales de Hawkes. Se estima la tasa de background de cada componente con una reconstrucción estocástica no paramétrica; ésta incluye una periodicidad temporal, una componente espacial separable y una tendencia a largo plazo. Para la estimación semi-paramétrica de los coeficientes de relajación se utiliza máxima verosimilitud para estabilizar y asegurar el proceso de estimación. Se sigue el algoritmo iterativo de Zhuang y Mateu (2019) y Zhuang (2006). Los modelos de procesos puntuales espacio-temporales son buenas herramientas matemáticas para analizar datos, por lo que los modelos descritos proporcionan predicciones confiables, como se muestra a lo largo de esta memoria con datos de delitos. Con la intención de ir más allá de la modelización y las predicciones de patrones puntuales, se formula un procedimiento para identificar las excedencias espaciales en LGCP bivariantes y sus regiones asociadas, así como también la cuantificación de la peligrosidad en términos de probabilidades. Para esto, se modeliza la descomposición espacial de los hurtos (delito sin uso de violencia) y robos a personas (delitos con uso de violencia o amedrentamiento) para representarlos en una variación asociada a un tipo de delito en particular, lo que es posible mediante una estructura estocástica compuesta por una componente dentro del flujo y otra entre flujos. Y se incorpora un enfoque de medidas de riesgo como el Valor en Riesgo y el Déficit Esperado (Malevergne y Sornette, 2006). Estas medidas están basadas en percentiles de la distribución de los delitos que exceden un umbral alto. Se considera una estructura de dependencia mediante la cópula extrema de Gumbel-Hougaard (Salvadori et al., 2007) y distribuciones marginales de Pareto generalizadas (Castellanos y Cabras, 2007; Abad et al., 2014). En general, se adopta un marco bayesiano con MCMC-MALA y máxima verosimilitud para la inferencia sobre los parámetros de los diferentes modelos. Se hace estudio de casos con datos reales de delitos registrados en la ciudad de Riobamba-Ecuador y algunas covariables temporales, espaciales y espaciotemporales. Los resultados obtenidos proporcionan información relevante sobre el modelizado, predicción y comportamiento extremo localizado de eventos delictivos; sin embargo, pueden ser de mucha utilidad para aplicarse a conjuntos de datos de diversas áreas. Finalmente, se exponen las conclusiones y se plantean algunas ideas abiertas.

  • English

    Statistical modeling is a set of mathematical formulations which provide a better understanding of phenomena, especially those that underlie relationships between variables that in turn have random influence. In this thesis work, the statistical modeling of criminal phenomena is carried out through the development of stochastic structures in spatio-temporal point processes, in order to reproduce events as accurately as possible to reality in terms of their evolution in space, time and space-time. First, the spatio-temporal dependence of spatially correlated self-excited processes is structured, considering a stochastic difference equation for the intensity of the spatio-temporal process, which captures both the dependence due to self-excitation and the dependence on an underlying spatial process. The reasoning of Clark and Dixon (2021) and Reinhart (2018) is followed, but capturing the nonlinearity of the spatio-temporal covariates by means of a generalized additive structure (GAM) with B-splines. Second, a latent spatio-temporal process model, i.e. a LGCP, is structured with a separable first order intensity function. The deterministic time component is the result of a generalized linear model (GLM) with meteorological covariate effects, days and months of the year, harmonic regression parameters, annual periodicity of incidence rates and global trend. For the spatial deterministic component a generalized additive model (GAM) is considered, following the reasoning, of Diggle et al. (2005), Taylor et al. (2013) and González and Mateu (2021), but with integrated smoothness estimation with univariate B-splines. And for the stochastic component, we consider a Gaussian field that models the spatio-temporal dependence and variation of the events. Thirdly, selfexcitation mechanisms are identified among the crime serie in a continuous time by means of Hawkes point processes. The background rate of each component is estimated with a nonparametric stochastic reconstruction; it includes a temporal periodicity, a separable spatial component and a long-term trend. The semi-parametric maximum likelihood estimation of the relaxation coefficients to stabilize and secure the estimation process, and the iterative algorithm of Zhuang and Mateu (2019) and Zhuang (2006) are followed. Spatio-temporal point process models are good mathematical tools for data analysis, and therefore, the described models provide reliable predictions, as shown throughout this thesis in crime data. In order to go beyond modeling and predictions of point patterns, a procedure is formulated to identify the spatial exceedances in bivariate LGCP and their associated regions, as well as the quantification of the hazard in terms of probabilities. For this, we model the spatial decomposition of thefts (crime without the use of violence) and robberies (crime with the use of violence or intimidation) to represent them in a variation associated with a particular type of crime, which is possible by means of a stochastic structure composed of a within-flow component and anotherone between-flows. For this modeling, we use log-Gaussian Cox processes along the same line of Taylor et al. (2015). And a focus on risk measures such as Value-at-Risk and Expeted Shorfall (Malevergne and Sornette, 2006) is incorporated. These measures are based on percentiles of the distribution of offenses exceeding a high threshold. A dependency structure using the extreme Gumbel-Hougaard copula is considered (Salvadori et al., 2007), and generalized Pareto marginal distributions (Castellanos and Cabras, 2007; Abad et al., 2014). In general, a Bayesian framework with MCMC-MALA and maximum likelihood is adopted for the inference on the parameters of the different models. A case study is developed with real data of crimes registered in the city of Riobamba-Ecuador and some temporal, spatial and spatio-temporal covariates. The results obtained provide relevant information on the modeling, prediction and extreme localized behavior of criminal events; however, they can be very useful to be applied to data sets of different areas. Finally, conclusions are drawn and some open ideas are put forward.


Fundación Dialnet

Mi Documat