Ir al contenido

Documat


Resumen de Word spotting and recognition in images from heterogenous sources

Suman Kumar Ghosh

  • Desde hace tiempo, texto es la manera m ́as com ́un de compartir informaci ́on . Con elreciente desarrollo de bases de datos de im ́agenes personales y documentos manuscritoshist ́oricos, la demanda de algoritmos para permitir que estas bases de datos sean nave-gables e indexables se encuentran al alza.Permitir la b ́usqueda o el entendimiento de una larga colecci ́on de manuscritos obases de datos de im ́agenes necesita m ́etodos r ́apidos y robustos. Investigadores hanencontrado diferentes maneras de representar palabras recortadas para entendemientoy emparejamiento, m ́etodos que funcionan bien cuando las palabras se encuentranya segmentadas. Sin embargo, no hay una manera trivial para extender esto paradocumentos no segmentados.En esta tesis nosotros exploramos diferentes m ́etodos para reconocer y recuperartexto de documentos e im ́agenes de escena sin segmentar. En la literatura exsitendos maneras distintas de representaci ́on, una usa una representaci ́on de longitud fijaaprendidad de palabras recortadas y otra una secuencia de caracter ́ısticas de longitudvariable. A trav ́es de esta tesis, nosotros hemos estudiado estas dos representacionespara su idoneidad en la comprensi ́on de texto sin segmentar. En la primera partenosotros nos enfocamos en la segmentaci ́on libre de palabras mediante el uso de unarepresentaci ́on de longitud fija. Extendimos el uso de la representaci ́on exitosa dePHOC (histograma de car ́acteres piramidales) a la recuperaci ́on sin segmentaci ́on.En la segunda parte de la tesis, exploramos caracter ́ısticas basadas en secuencias y,finalmente, proponemos una soluci ́on unificada donde el mismo marco puede generarlos dos tipos de representaciones.


Fundación Dialnet

Mi Documat