Contributions to Robust Multi-view 3D Action Recognition

Luis Díaz Mas

Ayuda

Contributions to Robust Multi-view 3D Action Recognition

Autores: Luis Díaz Mas
Directores de la Tesis: Rafael Muñoz Salinas (dir. tes.) , Juan Francisco Madrid Cuevas (codir. tes.)
Lectura: En la Universidad de Córdoba (ESP) ( España ) en 2012
Idioma: español
Tribunal Calificador de la Tesis: Nicolás Guil Mata (presid.) , Nicolás Luís Fernández García (secret.) , Mario Gongora (voc.)
Enlaces
- Tesis en acceso abierto en: Helvia
Resumen
- Esta tesis se centra en el reconocimiento de acciones humanas usando reconstrucciones volumétricas obtenidas a partir de múltiples cámaras monoculares. El problema del reconocimiento de acciones ha sido tratado usando diferentes enfoques, en los dominios 2D y 3D, y usando una o varias vistas. No obstante, el desarrollo de métodos de reconocimiento robustos, e independientes de la vista empleada, sigue siendo un problema abierto.
  
  Los enfoques multi-vista permiten explotar la información 3D para mejorar el rendimiento del reconocimiento. Sin embargo, manipular las grandes cantidades de información de las representaciones 3D plantea un importante problema. Como consecuencia, deben ser aplicadas técnicas estándar de reducción de dimensionalidad con anterioridad al uso de propuestas de aprendizaje. La primera contribución de este trabajo es un nuevo descriptor de información volumétrica que puede ser posteriormente reducido mediante técnicas estándar de reducción de dimensionalidad en los enfoques de reconocimiento holísticos y secuenciales. El descriptor, por si mismo, reduce la cantidad de datos hasta en un orden de magnitud (en comparación con descriptores previos) sin afectar al rendimiento de clasificación.
  
  El descriptor representa la información volumétrica obtenida en técnicas SfS. Sin embargo, esta familia de técnicas está altamente influenciada por los errores en el proceso de segmentación, de forma que el rendimiento del reconocimiento está significativamente afectado por este primer paso. La segunda contribución de este trabajo es una nueva técnica SfS (denominada SfSDS) que emplea la teoría de Dempster-Shafer para fusionar evidencias proporcionadas por múltiples cámaras. La idea central consiste en considerar la posición relativa entre cámaras de forma que se traten las inconsistencias en las siluetas y se obtenga reconstrucciones volumétricas robustas.
  
  La técnica SfS básica sigue teniendo un inconveniente principal; requiere que el volumen completo sea analizado para obtener la reconstrucción. Por otro lado, las representaciones basadas en octrees permiten salvar memoria y tiempo empleando una estructura de árbol dinámica donde sólo se almacenan los nodos ocupados. No obstante, la aplicación del método SfS a representaciones basadas en octrees no es directa. La contribución final de este trabajo es un método para la generación de octrees usando nuestra técnica SfSDS propuesta, de forma que se obtengan representaciones volumétricas robustas y compactas.