Ir al contenido

Documat


Resumen de Algoritmos de segmentación semántica para anotación de imágenes

César A. Ortiz Toro

  • Desde el punto de vista de la cognición humana quizás una de las habilidades mas significativas sea la capacidad de identificar y agrupar patrones visuales en elementos o conceptos abstractos significativos. Este proceso de agrupación perceptiva es la base de la capacidad para comprender y catalogar la información presente en las imágenes. Con el desarrollo de la informática, se plantea la posibilidad de extender los conceptos que rigen la percepción humana a sistemas computacionales, en lo que se conoce generalmente como anotación semántica de imágenes. Los métodos de anotación semántica de imágenes parten de características visuales de bajo nivel con las que se entrena un modelo con el que anotar nuevas imágenes.

    La capacidad de inferencia de este modelo de clasificación depende de la representatividad de las características visuales con las que se ha entrenado, en relación al problema que se trata. Características locales asociadas a objetos en la imagen son mucho mas representativas que características globales extraídas de la imagen completa. Sin embargo, el proceso de segmentación de una imagen representa un problema en si mismo. Sencillamente no es posible asegurar que los resultados de esta sean adecuados para su uso como base para extraer características.

    En este contexto, se propone como objetivo general de la Tesis el estudio, desarrollo y aplicación de diferentes algoritmos para abordar problemas relacionados con la anotación semántica de imágenes, trabajando a un nivel de particionado de la imagen inferior al de una segmentación, una sobre-segmentación. Una sobre-segmentación se define como un particionado bajo un criterio de uniformidad perceptual, sin buscar un significado semántico especifico. Conocidos comúnmente como superpixeles, el resultado de una sobre-segmentación respeta las fronteras presentes en las imágenes, produce elementos perceptualmente significativos y es mas sencilla de generar que una segmentación. En consecuencia, un superpíxel es un candidato adecuado como elemento base para la extracción de características. En particular, nos centraremos en la caracterización de imágenes a nivel de sobre-segmentación como base para la anotación semántica, planteando como casos de estudio problemas dentro de los dominios de imagen médica (bidimensional y volumétrica) e imagen óptica en teledetección (multiespectral e hiperespectral).


Fundación Dialnet

Mi Documat