Ir al contenido

Documat


Resumen de Segmentación y detección de objetos en imágenes y vídeo mediante inteligencia computacional

Miguel A. Molina Cabello

  • La presente tesis trata sobre el procesamiento y análisis de imágenes y video mediante sistemas informáticos.

    Primeramente se hace una introducción, donde se especifica el contexto, los objetivos y la metodología utilizados. Tras esto se muestran los antecedentes, señalando los fundamentos de la videovigilancia, área sobre la que se van a aplicar los modelos desarrollados, las dificultades existentes para modelar el fondo de las escenas de los videos y diversos algoritmos con la finalidad de detectar los objetos que aparecen en primer plano, seguido de las principales características del aprendizaje profundo, transporte inteligente y sistemas con cámara PTZ, exponiendo finalmente como se evalúan los métodos y distintos conjuntos de datos que se utilizan para tal fin.

    A continuación se muestran tres partes, cada una con diferentes apartados. La primera parte se basa en los estudios desarrollados que tratan sobre la fase de segmentación. En esta parte se explican diferentes modelos desarrollados cuyo objetivo es la detección de objetos en primer plano mediante el uso de hardware genérico o hardware especifico, como lo es el de bajo coste, la segmentación de objetos en un ámbito específico, como lo es la detección de glóbulos rojos en muestras de sangre, o el estudio de cómo influye la reducción del tamaño de las imágenes al rendimiento de los algoritmos basados a nivel de píxel.

    La segunda parte de la tesis describe los trabajos en los que se hace uso de una cámara PTZ. Así, en esta parte se presentan dos trabajos con esta particularidad. El primero de ellos hace un seguimiento del objeto más anómalo del escenario, siendo el propio sistema el que decide cuáles son los objetos anómalos y cuáles no, decisión que se basa en un modelo entrenado previamente con un video en el que no aparecen objetos anómalos. Por su parte, el segundo trabajo muestra un sistema que indica a la cámara los movimientos a realizar en función de la salida producida por un modelo de fondo no panorámico y mejorada con un gas neuronal creciente.

    La tercera parte es relativa a los estudios desarrollados que tienen relación con el transporte inteligente, como es la clasificación de los vehículos que aparecen en secuencias de tráfico. En uno de estos trabajos se aplican técnicas tradicionales como la segmentación y posterior extracción de rasgos o características; el segundo hace uso de una fase de segmentación y de varias redes convolucionales en lugar de la extracción de características, complementado con un estudio del redimensionado de las imágenes para proveerlas en el formato necesario a cada red; y el tercero utiliza un modelo de red que detecta y clasifica objetos, tras lo que se realiza una estimación de la contaminación generada por los vehículos.

    Por último, se exponen las conclusiones generales que se han obtenido tras la realización de la presente tesis y se comentan unas posibles líneas futuras de investigación que la amplíen y complementen.


Fundación Dialnet

Mi Documat