David Fernández López
RESUMEN DE LA TESIS DOCTORAL DE D. DAVID LÓPEZ FERNÁNDEZ.
1. Introducción o motivación de la tesis La biometría es el estudio automático para el reconocimiento único de humanos basado en uno o más rasgos conductuales o rasgos físicos intrínsecos. Algunos ejemplos de indicadores biométricos anatómicos típicos son la huella dactilar [1], el iris [2] y la cara [3], entre otros. Pero hay otros rasgos conductuales que pueden ser utilizados como indicador biométrico, como el paso humano [4][5].
En los últimos años, el paso humano como indicador biométrico ha recibido la atención de la comunidad investigadora por sus ventajas frente a otros métodos biométricos, como el reconocimiento facial o la huella dactilar, entre otros. La principal ventaja es que puede aplicarse a distancia, con imágenes de menor calidad, y sin requerir la participación activa del individuo [6].
Sin embargo, la mayoría de los métodos de reconocimiento del paso son dependientes del punto de vista. En estos métodos, los cambios del punto de vista de la cámara afectan negativamente al rendimiento, porque provocan cambios de apariencia en el sujeto [7]. Este hecho lleva a una dependencia con respecto a la trayectoria de los sujetos. Por ejemplo, cuando una persona camina a lo largo de una trayectoria curva, el ángulo de observación cambia gradualmente, y por tanto se producen cambios de apariencia.
2. Contenido de la investigación El principal objetivo de esta tesis es el desarrollo de nuevos métodos de reconocimiento del paso que sean independientes a la trayectoria de la marcha. Este objetivo se aborda desde el punto de vista del modelado de información en 3D, combinando varias fuentes para generar modelos en 3D que representen el paso del individuo observado.
El uso de modelos o reconstrucciones 3D tiene varias ventajas frente a los métodos tradicionales que basan su análisis sobre imágenes o siluetas 2D. En primer lugar, los modelos 3D del sujeto caminando pueden ser alineados a lo largo de la secuencia de paso, como si hubiera caminado sobre una cinta andadora, en una determinada dirección. Esto permite independizar los métodos de la trayectoria del movimiento, permitiendo cambios de dirección. Además, el alineamiento de volúmenes 3D permite adaptar métodos tradicionales basados en siluetas 2D [8,9,10], ya que estos pueden aplicarse sobre proyecciones (siluetas) de los volúmenes 3D alineados. En segundo lugar, el uso de reconstrucciones 3D permite aprovechar una mayor cantidad de información para ser analizada, en contraste con otros métodos de la literatura que obtienen la descripción del paso a partir de imágenes o siluetas 2D.
En esta investigación se plantean tres enfoques distintos para identificar personas a través de la forma de caminar, de una manera independiente de la trayectoria y desde el dominio 3D: (1) mediante la utilización de reconstrucciones volumétricas alineadas [11], (2) mediante el uso de reconstrucciones volumétricas no alineadas, y (3) sin usar reconstrucciones [12].
Se proponen además tres tipos de descriptores. El primero se centra en describir el paso mediante análisis morfológico de los volúmenes 3D alineados [8]. El segundo hace uso del concepto de entropía de la información [9, 11]. Mediante la aplicación del concepto de entropía, aplicado sobre los vóxeles de las reconstrucciones 3D, se pretende describir la dinámica del paso humano a lo largo del tiempo sobre una ventana deslizante temporal. El tercero persigue capturar la dinámica de una forma invariante a rotación [12], lo cual lo hace especialmente interesante para ser aplicado tanto en trayectorias curvas como rectas, incluyendo cambios de dirección. Para ello, se propone un descriptor invariante a rotación, basado en análisis angular 3D del modelo reconstruido.
Estos descriptores se combinan en el tiempo, sobre una ventana deslizante temporal, formando lo que se conoce en la literatura como la firma del paso. Cada una de estas firmas representa el patrón de paso del sujeto extraído en un determinado instante, un vector de características al que se le asigna una etiqueta de clase correspondiente a la identidad de cada sujeto. Para el entrenamiento y clasificación, se emplean máquinas de vector soporte (SVM), mientras que para reforzar los resultados de clasificación a lo largo de cada secuencia, se utiliza una ventana deslizante temporal con política de voto mayoritario. Debido a la alta dimensionalidad de los vectores de características que resultan de algunas de estas propuestas, se emplean técnicas de reducción tales como Análisis de los Principales Componentes (PCA) y Análisis Discriminante Lineal (LDA).
Estos enfoques se han probado sobre dos bases de datos públicas [13, 14]. Ambas están específicamente diseñadas para tratar el problema de la dependencia con respecto al punto de vista, y por tanto de la dependencia con respecto a la trayectoria. Una de ellas ha sido generada durante el trascurso de esta investigación para aplicar métodos multi-vista de reconocimiento del paso. Para extender el análisis de los métodos propuestos, se ha realizado una comparación de rendimiento frente a otros enfoques y métodos presentes en el estado del arte.
3. Conclusión En primer lugar, este trabajo presenta un estudio métodos para reconocimiento del paso propuestos en la literatura y de las bases de datos disponibles para aplicar métodos de reconocimiento del paso.
Las diferentes propuestas para abordar el problema de la identificación de personas mediante el análisis de la forma de caminar usando información fusionada a partir de múltiples vistas, han contribuido al avance en el campo de conocimiento al permitir que este reconocimiento se pueda realizar de manera independiente al punto de vista y sin estar restringido a trayectorias rectas, incluso permitiendo cambios de dirección.
Se ha presentado una metodología basada en reconstrucciones 3D y alineamiento del paso para aplicar, sobre proyecciones de los modelos 3D alineados, métodos 2D convencionales de una manera invariante a la trayectoria de la marcha.
Los resultados experimentales muestran que para el enfoque basado en reconstrucciones volumétricas alineadas, el descriptor basado en entropía consigue los mejores resultados, en comparación con métodos estrechamente relacionados del estado del arte actual. No obstante, el descriptor invariante a rotación consigue una tasa de reconocimiento que supera a los métodos del estado del arte sin requerir la etapa previa de alineamiento de las reconstrucciones 3D. Por último, el uso de la ventana deslizante temporal con política de voto mayoritario mejora considerablemente los resultados de clasificación en todas las propuestas.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados