Ir al contenido

Documat


Resumen de Contribución al reconocimiento de objetos 2D mediante aproximaciones poligonales

Luis del Moral Martínez

  • 1. Introducción La visión por computador, o visión artificial, es una disciplina científica que desarrolla métodos que permiten emular los procesos de la visión humana en un ordenador.

    El proceso que se emplea para reconocer objetos de una imagen del mundo real recibe el nombre de reconocimiento de patrones. Este proceso se engloba en un proceso que se denomina procesamiento digital de imágenes, que se divide a su vez en cinco etapas:

    1. Digitalización: se captura una imagen del mundo real y se transforma en una imagen digital mediante un proceso de discretización.

    2. Preprocesamiento: su objetivo principal es transformar la imagen digital para obtener otra de mayor calidad que facilite el desarrollo de las siguientes etapas.

    3. Segmentación: se extrae información de la imagen digital mediante su descomposición en unidades de información homogéneas.

    4. Representación y descripción: se parametrizan los objetos identificados en la etapa anterior y se extraen los descriptores de la imagen (elementos de información que permiten definir la imagen de forma cualitativa).

    5. Reconocimiento e interpretación: se reconocen y clasifican cada uno de los objetos que forman la escena, en función de sus propiedades y características. Se interpretan los grupos de objetos reconocidos con la misión de dar un significado a la imagen.

    El presente trabajo ha permitido contribuir al reconocimiento de objetos 2D mediante el diseño de nuevos algoritmos de generación de aproximaciones poligonales.

    2. Contenido de la investigación Esta investigación propone nuevas técnicas de umbralización unimodal aplicadas a la generación de aproximaciones poligonales. Estas técnicas se han comparado con las estrategias de umbralización clásicas propuestas por Rosin.

    Asimismo, se propone un nuevo método que obtiene aproximaciones poligonales de manera no supervisada; es decir, no paramétrica. Este método incorpora una etapa de umbralización unimodal.

    Se ha realizado un análisis exhaustivo del método propuesto para diseñar nuevas versiones, según la combinación de las características de algunas de sus etapas. Se han considerado dos estrategias principales: estrategia de división de puntos y estrategia de fusión de puntos. Se han comparado las nuevas versiones propuestas con respecto al método original y se han obtenido nuevas versiones que representan una mejora considerable, mejorando también a todas las estrategias clásicas analizadas.

    Finalmente, se ha incorporado una fase adicional de optimización, que se basa en el método propuesto por Masood. Posteriormente, se ha realizado un estudio comparativo para seleccionar la versión más eficiente de cada estrategia, así como la versión que obtiene el mejor resultado de entre todas ellas. Las versiones optimizadas mejoran al algoritmo original propuesto y a todas las demás versiones analizadas.

    3. Conclusión El desarrollo de esta Tesis Doctoral ha permitido proponer un nuevo método automático que genera aproximaciones poligonales de contornos cerrados de objetos bidimensionales. Como consecuencia del trabajo desarrollado, se han obtenido las siguientes conclusiones: 1. En primer lugar, se ha desarrollado un nuevo método split que genera aproximaciones poligonales: a. Se basa en el concepto de umbralización unimodal de los niveles de significación de los puntos del contorno.

    b. Se compone de seis etapas.

    c. Se ha comprobado que obtiene mejores resultados que la versión split automatizada del método de Ramer, Douglas–Peucker (RDP) y que las versiones merge automatizadas de los métodos de Carmona y Masood, presentados por Prasad et al.

    El nuevo algoritmo diseñado ha sido publicado en la revista Journal of Visual Communication and Image Representation (Fernández-García, L. Del-Moral et. al, 2016).

    2. Se ha desarrollado un análisis exhaustivo del método propuesto: a. Este estudio se ha basado en el análisis de las estrategias split y merge.

    b. En el estudio se han definido 288 versiones split y 18 versiones merge.

    c. Los experimentos han demostrado que una versión split, basada en el uso del casco convexo y que emplea la medida Emax y el método de umbralización semi-adaptativo, ha obtenido los mejores resultados, superando incluso al nuevo método propuesto.

    3. Por último, se ha completado el análisis incorporando una etapa final de optimización: a. El método de optimización se basa en el método propuesto por Masood.

    b. Las pruebas desarrolladas demuestran que el método optimizado mejora a todas las versiones split y merge propuestas, mejorando también al método original de forma significativa.

    En resumen, el desarrollo de esta Tesis Doctoral ha permitido obtener un método heurístico que genera aproximaciones poligonales eficientes. Estas aplicaciones pueden ser utilizadas en aplicaciones de tiempo real, superando las dificultades que presentan los algoritmos óptimos, que requieren de una carga computacional mayor.

    4. Principal bibliografía de la tesis A. Carmona-Poyato, N.L. Fernández-García y R. Muñoz-Salinas. (2010). A New Algorithm for Dominant Point Detection by Quasi-Collinear Break Points Suppresion. Lecture Notes in Computer Science, 23, 474-484. DOI: 10.1007/978-3-540-88458-3_43.

    D.H. Douglas y T.K. Peucker. (1973). Algorithms for the reduction of the number of points required to represent a digitized line or its caricature. Cartographica: The International Journal for Geographic Information and Geovisualization, 10, 112-122. DOI: 10.3138/FM57-6770-U75U-7727.

    N.L. Fernández-García, L. Del-Moral Martínez, A. Carmona-Poyato, F.J. Madrid-Cuevas y R. Medina-Carnicer. (2016). A new thresholding approach for automatic generation of polygonal approximations. Journal of Visual Communication and Image Representation, 35, 155-168. DOI: 10.1016/j.jvcir.2015.12.013.

    A. Masood y S.A. Haq. (2007). A novel approach to polygonal approximation of digital curves. Journal of Visual Communication and Image Representation, 18, 264-274. DOI: 1016/j.jvcir.2006.12.002.

    A. Masood. (2008). Optimized polygonal approximations by dominant point deletion. Pattern Recognition, 41, 227-239. DOI: 10.1016/j.patcog.2007.05.021.

    D.K. Prasad, M.K.H Leung, C. Quek y S.Y. Chor. (2012). A novel framework for making dominant point detection methods non-parametric. Image and Vision Computing, 30, 843-859. DOI: 10.1016/j.imavis.2012.06.010.

    U. Ramer. (1972). An iterative procedure for the polygonal approximation of plane curves. Computer Graphics and Image Processing, 1, 244-256. DOI: 10.1016/S0146-664X(72)80017-0.


Fundación Dialnet

Mi Documat