Ir al contenido

Documat


Resumen de Algorithms for the Multiple Variants of Registration in 3D Range Data

Javier Mateo Prous

  • Des del naixement de la fotografia hi ha hagut sempre un gran interès en la possibilitat de detectar una tercera dimensió en les imatges obtingudes per una càmera. Aquesta tercera dimensió permetria la diferenciació i filtrat dels diferents objectes presents a una escena, i per tant facilitar molts del problemes actuals en la recerca de visió per computador. Per tal d'aconseguir-la, diverses tècniques s'han anat utilitzant a través del temps, des de la clàssica estereoscopia fins a altres mètodes més actuals com el Structure from Motion. Durant els darrers anys l'evolució de la tecnologia ha fet possible l'aparició de dispositius que permeten la captura directa d'aquesta informació 3D sense la necessitat d'una intervenció manual. L'ús de diferents espectres de llum com el làser o la llum infraroja, així com la seva integració en els dispositius, han possibilitat aquesta important millora, acompanyada al mateix temps d'una reducció en el preu dels components que ha fet possible el seu ús per gran part de la comunitat de recerca. Aquesta tesis està enfocada en el principals problemes derivats de l'ús de les anomenades càmeres range que, a més de la imatge RGB usual, ofereixen una imatge addicional indicant la distància als objectes de l'escena. Gràcies a l'aplicació directa d'aquestes imatges range, on cada píxel correspon a una distancia, una recreació 3D de l'escena capturada pot ser obtinguda fàcilment. Una de les seves principals avantatges és el fet de que, si la càmera està correctament calibrada, el 3D obtingut es troba expressat en unitat físiques reals (per exemple, en metres) i no pas en píxels. Tot i això, l'ús d'aquestes càmeres range no és tan ideal com es podria suposar. Normalment diverses captures d'una escena o objecte són necessàries per tal d'aconseguir una reconstrucció completa, i alguns materials poden produir problemes que interfereixen en el correcte posicionament dels objectes. Les particularitats de la representació 3D obtinguda fan que aquesta sigui apropiada per fer-la servir com a suport per afegir-hi altres fonts d'informació, com ara imatges RGB o imatges infraroges. L'estructura 3D obtinguda pot ser texturitzada amb aquestes fonts d'informació, donant un resultat integrat que pot ser molt útil per solucionar problemes que no serien possibles utilitzant les imatges de forma separada. Tot i això, diferències en el procés d'adquisició entre aquest tipus d'imatges poden produir alguns problemes quan són fusionades. A més, per tal d'obtenir una reconstrucció 3D completa d'una escena, normalment és necessari que la captura s'hagi fet des de múltiples punts de vista diferents. L'alineament de totes aquestes estructures 3D obtingudes és conegut com registració multivista, on és necessari identificar la posició i orientació de les càmeres range en cadascuna de les presses per tal de poder alinear-les correctament. Aquest alineament s'aconsegueix normalment fen servir dos passos diferenciats: la registració de imatges rang parell a parell, i la posterior minimització de l'error considerant simultàniament totes aquestes parelles.


Fundación Dialnet

Mi Documat