El campo del reconocimiento de acciones humanas ha recibido y recibe en la actualidad una especial atención debido a sus numerosas áreas de aplicación, De entre todas las técnicas aplicables a este campo los modelos de espacios de estados que usan herramientas estadísticas se han revelado como un efectivo método capaz de afrontar la incertidumbre asociada a las acciones humanas. Un amplio rango de modelos gráficos probabilísticos han sido propuestos en la literatura, pero no todos han sido evaluados en profundidad en el campo del reconocimiento de acciones, como por ejemplo los modelos ocultos de Markov factoriales que se han enfocado principalmente en reconocer personas caminando, o en el caso de los campos aleatorios condicionales con estados ocultos en el reconocimiento de gestos.
En esta tesis, contextualizamos los principales tipos de modelos gráficos probabilísticos, dirigidos y no dirigidos, en el ámbito del reconocimiento de acciones humanas, examinando sus ventajas y desventajas frente al problema tratado y realizando un completo estudio experimental. Mientras otros trabajos encontrados en la literatura generalmente se limitan a comparar dos o tres de estos modelos, en esta tesis atacamos esta comparación bajo una metodología común y una misma base de datos considerada estándar en este campo que nos permite inferir conclusiones generales.
Así mismo, adaptamos a nuestro problema otros modelos gráficos propuestos en otros campos pero que por sus propiedades creemos que pueden ser especialmente adecuados en la tarea que nos ocupa. Este es el caso de los campos aleatorios de Markov generativos, especificados para el reconocimiento de objetos en imágenes estáticas y que nosotros extendemos a tratar señales temporales, su definición nos va a permitir estudiar densas relaciones entre los estados de las variables en distintos instantes de tiempo. El producto de modelos ocultos de Markov, usados en el procesamiento del lenguaje escrito, se revela en este trabajo como una interesante alternativa a los modelos probabilísticos actuales en el reconocimiento de acciones, con mayor capacidad representativa que los tradicionales modelos ocultos de Markov, son capaces de modelar acciones generadas por movimientos concurrentes que evolucionan con distinta dinámica, así como la estructura de un movimiento en múltiples escalas de tiempo de un modo eficiente frente a otros modelos de Markov multi-cadena como los factoriales o los acoplados gracias a su topología. Nosotros reformulamos este modelo para incorporar distribuciones estadísticas con varias componentes gaussianas, ya que usualmente las distintas realizaciones de una misma acción humana presentan demasiada variabilidad para ser modeladas por una distribución simple.
En este trabajo también abordamos el principal escollo en los modelos con conexiones no dirigidas, la constante de normalización global, generalmente de coste computacional prohibitivo, nosotros proponemos un esquema de muestreo por importancia basado en enfriamiento para estimar esta constante de forma plausible en el caso del producto de modelos ocultos de Markov.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados