Esta tesis consta principalmente de dos partes. La primera de ellas se basa en una revisión de conceptos y modelos que han sido de utilidad para poder llevar a cabo este estudio. La segunda es la que abarca la mayor parte, y en ella se expone un nuevo modelo de análisis probabilista para el estudio de la seguridad de carreteras basado en Redes bayesianas.
Las redes bayesianas emplean la estructura probabilística de una variable aleatoria multidimensional basada en un gráfico acíclico y un conjunto de probabilidades condicionales para realizar el análisis probabilístico de seguridad. Debido a las grandes ventajas que presentan frente a otros métodos empleados, como son los métodos de regresión o los árboles de fallo, se han empezado a utilizar en los últimos años en muy diversos campos: en inteligencia artificial, procesos de excavación de túneles, biomedicina, plantas nucleares, y más recientemente en líneas ferroviarias. Lo que se pretende en esta tesis es realizar un análisis de seguridad en carreteras por lo que esta primera parte se centra en modelos de redes bayesianas centrados en la seguridad vial. De esta forma, se presentan modelos con diferentes finalidades: a) predecir la frecuencia con la que ocurren accidentes de diferente tipo, b) clasificar accidentes de tráfico en función de su severidad, c) analizar y prevenir accidentes, d) desarrollar evaluaciones de la seguridad, etc.
Por otro lado, sin el conocimiento de ciertos aspectos sobre grafos no sería posible una correcta construcción de un modelo de redes bayesianas. Por este motivo y así poder clarificar conceptos y métodos empleados se presentan diferentes ilustraciones explicativas en las que se emplean variables utilizadas posteriormente en el modelo propuesto.
En la segunda parte se presenta un nuevo modelo para el estudio de la seguridad de carreteras que emplea un análisis probabilístico basado en redes bayesianas. El problema del análisis de seguridad es un problema indudablemente aleatorio, ya que prácticamente todas las variables que intervienen en el mismo lo son. Ello requiere evaluar probabilidades de ocurrencia de sucesos y frecuencias asociadas a los diferentes elementos intervinientes.
Un primer problema surge a la hora de representar las dependencias entre las variables.
Los árboles de fallos, tienen algunas limitaciones importantes, entre las que destaca la de no poder representar fácilmente las causas comunes de fallos. La estructura de árbol, es decir con ramas abiertas, no permite cerrarlas, lo que sería necesario para reproducir las causas comunes sin replicar las variables correspondientes. Por el contrario, las redes bayesianas no tienen esta limitación y permiten su reproducción sin necesidad de replicar estas variables. Otra ventaja notable consiste en que, al utilizar grafos dirigidos, pueden cerrarse y definir la probabilidad conjunta de todas las variables mediante las probabilidades condicionales de cada nodo dados sus padres. Además, estas redes permiten reproducir cualquier estructura de dependencia sin producir incompatibilidades, que pueden ocurrir cuando la definición de la probabilidad conjunta se hace con distribuciones condicionadas arbitrarias. Otra gran ventaja es que todas las probabilidades condicionales anteriores pueden definirse independientemente. Finalmente, hay que indicar que existen paquetes de software muy potentes e incluso gratuitos, que ya han sido muy probados y que permiten implementar estas estructuras en ordenador sin grandes esfuerzos adicionales. Todas estas ventajas son las que han conducido a elegir las redes bayesianas como modelo óptimo para resolver este problema.
En el modelo de red bayesiana se reproducen todos los elementos existentes en la carretera y que el conductor se encuentra cuando circula por ella. Cada elemento contribuye con un conjunto de variables en función de su tipo. Por ejemplo, las curvas incluyen su radio, longitud, sentido, etc, las señales incluyen su estado, las decisiones del conductor al verlas, las velocidades asociadas, las distancias entre señales, etc, y así ocurre con cada uno de los elementos o ítems establecidos. Debido a la gran importancia del error humano en el ámbito de la seguridad, se introducen en la modelización variables asociadas al comportamiento de los conductores, como son el cansancio y atención del conductor; así como el tipo de conductor o decisión de la velocidad adoptada o ante la presencia de una señal. Todas las variables son consideradas como aleatorias y sus dependencias son reproducidas por la red bayesiana, de tal manera que cualquier conjunto de probabilidades pueda ser calculado mediante un proceso de marginalización hacia adelante. Los conjuntos de probabilidades condicionales de las variables, dados sus padres, se establecen mediante fórmulas cerradas que permiten cuantificar la red bayesiana. Para reducir la complejidad del problema, se plantea utilizar un método que divide la red bayesiana en pequeñas partes, tales que la complejidad del problema se convierte en lineal en el número de elementos. Esto es crucial para tratar con casos reales en las que el número de variables puede medirse en miles.
La probabilidad de incidentes relacionados con los diferentes tramos de carreteras se calculan en función de un número equivalente de incidentes severos, de manera que se puedan identificar los elementos más críticos y clasificarlos por orden de importancia.
Esto permite obtener una información muy relevante para mejorar la seguridad y ahorrar tiempo y dinero en las medidas que son necesarias adoptar para mejorar determinadas carreteras. Además, cuando ocurre un accidente, la red bayesiana puede ayudar a identificar sus causas por medio de un proceso de propagación de inferencia hacia atrás.
Diferentes ejemplos de carreteras españolas, A-67, N-611 y CA-182, son representados para exponer el funcionamiento del modelo que se plantea. En particular, se realiza un detallado estudio por medio de este nuevo método de análisis de seguridad de las carreteras de la red autonómica de Cantabria, CA-131, CA-132 y CA-142.
This thesis consists mainly of two parts. The first one is based on a review of concepts and models that have been useful to carry out this study. The second is the one that covers the majority of the work, where a new model of probabilistic analysis for the study of road safety based on Bayesian Networks is presented.
Bayesian networks use the probabilistic structure of a multidimensional random variable based on an acyclic graph and a set of conditional probabilities to perform a probabilistic safety analysis. Due to the great advantages that they present with respect to other methods used, such as regression or failure tree methods, they have been used in the last years in many different fields: artificial intelligence, tunneling processes, biomedicine, nuclear plants, and more recently on railway lines. What is intended in this thesis is to perform a safety analysis on roads so this first part focuses on models of Bayesian networks applied to road safety. In this way, models with different purposes are presented: a) predicting the frequency with which accidents of different types occur, b) classifying traffic accidents according to their severity, c) analyzing and preventing accidents, and d) safety.
On the other hand, without the knowledge of certain aspects on graphs would not be possible a correct construction of a model of Bayesian networks. For this reason and thus to be able to clarify concepts and methods used, different explanatory illustrations are presented in which variables used later in the proposed model are utilized.
The second part presents a new model for the study of road safety using a probabilistic analysis based on Bayesian networks. The problem of the safety analysis is an undoubtedly random problem, since practically all the variables that intervene in the same one are random. This requires evaluating probabilities of occurrence of events and frequencies associated with different intervening elements. A first problem arises when representing the dependencies between the variables. Fault trees have some important limitations, including failure to easily represent common causes of failure. The tree structure, i.e. with open branches, does not allow closing them, which would be necessary to reproduce the common causes without replicating the corresponding variables. In contrast, Bayesian networks do not have this limitation and allow their reproduction without the need to replicate these variables. Another notable advantage is that, when using directed graphs, they can be closed and the joint probability of all variables determined by the conditional probabilities of each node given by their parents. In addition, these networks can reproduce any dependency structure without producing incompatibilities, which can occur when the definition of joint probability is made with arbitrary conditional distributions.
Another great advantage is that all of the above conditional probabilities can be defined independently. Finally, it should be noted that there are very powerful and even free software packages, which have already been tried and tested, and which allow the implementation of these computer structures without any extra effort. All these advantages are what have led to choosing the Bayesian networks as the optimal model to solve this problem.
The Bayesian network model reproduces not only all the existing elements on the road but the driver's behaviour when he is driving through it. Each element contributes a set of variables according to their type. For example, curves include their radius, length, direction, etc., the signals include their state, the driver's decisions upon seeing them, the associated speeds, the distances between signals, and so on. Due to the great importance of human error in the field of safety, modeling variables associated with driver's behaviour are introduced, such as driver's tiredness and attention; as well as the type of driver or decision of the adopted speed or the presence of a signal. All variables are considered as random and their dependencies are reproduced by the Bayesian network, so that any set of probabilities can be calculated through a process of forward marginalization. The sets of conditional probabilities of the variables, given their parents, are established by means of closed formulas that allow to quantify the Bayesian network. To reduce the complexity of the problem, we propose to use a method that divides the Bayesian network into small parts, such that the complexity of the problem becomes linear in the number of elements. This is crucial to deal with real cases where the number of variables can be measured in thousands.
The probability of incidents related to the different road sections is calculated according to an equivalent number of severe incidents, so that the most critical elements can be identified and ranked in order of importance. This allows to obtain very relevant information to improve the safety and to save time and money in the measures that are necessary to adopt to improve certain roads. In addition, when an accident occurs, the Bayesian network can help identify its causes through a process of inference propagation backwards.
Different examples of Spanish roads, A-67, N-611 and CA-182, are represented to expose the operation of the model that arises. In particular, a detailed study of the regional network in Cantabria, CA-131, CA-132 and CA-142, is carried out by means of this new method.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados