Resumen de Estrategias de visión por computador para la estimación de pose en el contexto de aplicaciones robóticas industriales: avances en el uso de modelos tanto clásicos como de deep learning en imágenes 2D

Ibon Merino Bermejo

La visión por computador es una tecnogía habilitadora que permite a los robots y sistemas autónomospercibir su entorno. Dentro del contexto de la industria 4.0 y 5.0, la visión por ordenador es esencial parala automatización de procesos industriales. Entre las técnicas de visión por computador, la detección deobjetos y la estimación de la pose 6D son dos de las más importantes para la automatización de procesosindustriales. Para dar respuesta a estos retos, existen dos enfoques principales: los métodos clásicos y losmétodos de aprendizaje profundo. Los métodos clásicos son robustos y precisos, pero requieren de unagran cantidad de conocimiento experto para su desarrollo. Por otro lado, los métodos de aprendizajeprofundo son fáciles de desarrollar, pero requieren de una gran cantidad de datos para su entrenamiento.En la presente memoria de tesis se presenta una revisión de la literatura sobre técnicas de visión porcomputador para la detección de objetos y la estimación de la pose 6D. Además se ha dado respuesta alos siguientes retos: (1) estimación de pose mediante técnicas de visión clásicas, (2) transferencia deaprendizaje de modelos 2D a 3D, (3) la utilización de datos sintéticos para entrenar modelos deaprendizaje profundo y (4) la combinación de técnicas clásicas y de aprendizaje profundo. Para ello, sehan realizado contribuciones en revistas de alto impacto que dan respuesta a los anteriores retos.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: