Ir al contenido

Documat


Resumen de Visual localization for robotics: metric, topological and higher abstraction levels

Ana Cristina Murillo Arnal Árbol académico

  • Cada vez vemos más sistemas robóticos a nuestro alrededor, que salen del típico puesto en cadenas de montaje para formar parte de tareas de servicio o rescate. Muchas de estas aplicaciones están basadas en sensores de visión, los cuales se han extendido mucho en los ultimos años por las ventajas que ofrecen respecto a otros sensores: gran cantidad de información, medidas a larga distancia, bajo coste, tamaño reducido o facilidad de uso. El área de visión por computador abarca gran cantidad de temas y está teniendo una evolución muy rápida; sin embargo, se observa un gran salto entre sus últimos avances y las aplicaciones robóticas basadas en visión. Puede que este salto se deba a la divergencia en los objetivós de las áreas de visión y robótica o a que muchos métodos de visión por computador resultan poco adecuados para los requerimientos en robótica y tiempo real. El objetivo de esta tesis es desarrollar métodos para localización, una tarea necesaria en cualquier sistema móvil autónomo, basados en visión.

    Un sistema autónomo necesita localizarse a si mismo y a los elementos a su alrededor para poder moverse e interactuar de manera inteligente con su entorno. El problema de localización puede resolverse en distintos niveles semánticos y esta tesis intenta estudiar un amplio rango de ellos.

    En particular, se han estudiado: * Correspondencias en imágenes: buscar correspondencias entre distintas vistas de una escena es una tarea de bajo nivel necesaria para la mayoría de trabajos en visión por - computador que depende mucho de la tarea a realizar. Esta tesis analiza los métodos más adecuados para nuestros objetivos.

    * Localización global métrica: la base geométrica de las imágenes permite relacionar varias vistas de una escena y recuperar la posición en ella de cámaras y elementos en las imáagenes. Este trabajo se centra en el caso de líneas como características en las imágenes y en el uso de información angular 1D.

    * Localización topológica: cercana al reconocimiento de lugares y búsqueda de imágenes en bases de datos, evalua la similaridad de la imagen actual respecto a un conjunto de imágenes de referencia o mapa visual. Esta parte de la tesis presenta un proceso jerárquico que proporciona varios niveles semánticos de localización,,centrándose en el nivel topológico e integrándolo con el nivel métrico.

    * Niveles más altos de abstracción: por último esta tesis se centra en reconocer e interpretar el entorno del robot en un nivel semántico más alto y cercano a conceptos humanos. Primero, se analizan modelos para reconocimiento en interiores de objetos de interés para el robot como las puertas. Además se presenta un método para segmentar zonas dominantes a lo largo de un video y detectar el resto de zonas, qué podrían contener objetos de interés. Por último, debido a que el trabajo futuro apunta al procesamiento en videos, se ha adaptado la característica local 2D SURF a un entorno espacio-temporal 3D.


Fundación Dialnet

Mi Documat