La habilidad para analizar y describir la información contenida en las imágenes provenientes de escenarios reales o diseñados por el hombre es una tarea que resulta retadora y atractiva para diferentes áreas de la ciencia. Este trabajo presenta tres algoritmos evolutivos los cuales analizan el contenido de la imagen para tres aplicaciones de la Visión por Computadora, como lo es: la segmentación, el reconocimiento de objetos y la creación de mosaico de imágenes. Por un lado se realiza un análisis del contenido de imágenes con textura utilizando descriptores estadísticos por medio de la matriz de co-ocurrencia para llevar a cabo la segmentación. Por otro lado, se proponen nuevos descriptores locales que describen el contenido de la imagen para reconocer objetos en escenarios al interior y al exterior así como para crear mosaico de imágenes a partir de fotografías. En ambos casos, el análisis del contenido de la imagen es requerido para llevar a cabo la tarea lo más eficientemente posible. En el primer trabajo presentamos nuestro algoritmo de segmentación EvoSeg el cual utiliza conocimiento derivado del análisis de textura para identificar el número de regiones homogéneas existentes en la escena sin contar con ninguna información a priori. EvoSeg utiliza descriptores estadísticos en una matriz de co-ocurrencias en escala de grises y optimiza una medida de aptitud basada en el criterio de varianza mínima usando un algoritmo genético canónico. Posteriormente, se incorpora interacción dentro del proceso de optimización del algoritmo EvoSeg en donde una persona experta interactúa con el sistema ayudando a mejorar los resultados. La interacción permite al algoritmo adaptarse usando esta nueva información externa basada en el criterio del experto. Por otro lado, se describe una metodología basada en la programación genética que sintetiza expresiones matemáticas que son usadas para mejorar el conocido descriptor del estado del arte, SIFT (Scale Invariant Feature Transform). El mecanismo de reconocimiento de este trabajo está inspirado en la idea de cómo se hace el reconocimiento en la corteza cerebral de los primates al hacer uso de características de una complejidad intermedia que son invariantes a cambios de escala, localización e iluminación de manera natural. Estas características locales han sido diseñadas por personas expertas en el área que hacen uso de las representaciones tradicionales a través de definiciones matemáticas bien fundamentadas. Sin embargo, no es muy claro que estas mismas representaciones sean implementadas por el sistema natural de la misma manera. Es por ello, que la posibilidad para diseñar novedosos operadores a través de la programación genética representa una linea de investigación abierta donde la búsqueda combinatoria de los algoritmos evolutivos pueden exceder a la habilidad de los expertos. En ese sentido, este trabajo provee evidencia que la programación genética tanto canónica como multiobjetivo es capaz de diseñar nuevas características que mejoran el rendimiento general de los mejores descriptores locales disponibles en la actualidad. Para ello, los resultados experimentales confirman la validez de nuestro enfoque usando un protocolo de evaluación ampliamente aceptado, así como también el uso de nuestro mejor descriptor RDGP2 en el reconocimiento de objetos y el MORDGP en el caso de creación de mosaico de imágenes.
The ability to analyse and describe the image content from real or designed scenarios is a challenge and an attractive task for computer vision. This work presents three evolutionary algorithms which analyse the image content for three particular high level tasks such as: image segmentation, object recognition and image mosaicing. On the one hand, the image content is analysed using statistical descriptors in a Gray Level Co-ocurrence Matrix (GLCM) in order to achieve good image segmentations. On the other hand, new local descriptor operators are proposed using genetic programming. These operators describe the image content in order to recognize objects localized within indoor and outdoor scenarios presenting different image transformations. First, we present our EvoSeg algorithm, which uses knowledge derived from texture analysis to identify how many homogeneous regions exist in the scene without a priori information. EvoSeg uses texture features derived from the GLMC and optimizes a fitness measure, based on the minimum variance criteria, using a hierarchical GA. Later, we include interaction within the EvoSeg optimization process obtaining a new algorithm named I-EvoSeg. This algorithm complements the chosen texture information with direct human interaction in the evolutionary optimization process. Interactive evolution helps to improve results by allowing the algorithm to adapt using the new external information based on user evaluation. On the other hand, we describe a genetic programming methodology using a canonical and multi-objective approach, that synthesizes mathematical expressions that are used to improve a well known local descriptor algorithm named SIFT (Scale Invariant Feature Transform). It follows the idea that object recognition in the cerebral cortex of primates makes use of features of intermediate complexity that are largely invariant to change in scale, location, and illumination. These local features have been previously designed by human experts using traditional representations that have a clear, preferably mathematically, well-founded definition. However, it is not clear that these same representations are implemented by the natural system with the same representation. Hence, the possibility to design novel operators through genetic programming represents an open research avenue where the combinatorial search of evolutionary algorithms can largely exceed the ability of human experts. Hence, we provide evidence that genetic programming is able to design new features that enhance the overall performance of the best available local descriptor. Experimental results confirm the validity of the proposed approach using a widely accept testbed for evaluating local descriptors. Finally, we used our evolved descriptors in object recognition application and image mosaicing.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados