Ir al contenido

Documat


La visió per computador com a eina per a la interpretació automàtica de fonts documentals

  • Alicia Fornés [1] ; Josep Lladós [1] ; Oriol Ramos [1] ; Marçal Rusiñol [1]
    1. [1] Universitat Autònoma de Barcelona

      Universitat Autònoma de Barcelona

      Barcelona, España

  • Localización: Lligall: revista catalana d'Arxivística, ISSN 1130-5398, Nº. 39, 2016 (Ejemplar dedicado a: Digitalització i reconeixement de caràcters: quan les màquines llegeixen documents), págs. 18-44
  • Idioma: catalán
  • Enlaces
  • Resumen
    • español

      La visión por computador es la disciplina informática que se encarga de diseñar algoritmos que interpretan las imágenes digitales. Cuando las imágenes corresponden a documentos digitalizados, nos encontramos en la subdisciplina del análisis y reconocimiento de imágenes de documentos. En este artículo hacemos un repaso de la situación actual de esta tecnología y de sus posibilidades de aplicación en la resolución tanto de los problemas más tradicionales de lectura óptica (ROC), como de los que están asociados a otras tipologías de documentos tales como los manuscritos, especialmente los históricos, y los gráficos. En primer lugar, hacemos un repaso del estado de la cuestión de la tecnología. A continuación describimos dos casos prácticos a raíz de proyectos llevados a cabo en el Centro de Visión por Computador de la UAB y de relevancia en el ámbito archivístico: el análisis masivo de documentos administrativos y de documentos demográficos históricos manuscritos.

    • English

      Computer vision is a discipline of Computer Science that designs algorithms that interpret digital images. When these images involve digitalized documents, we enter the subdiscipline of document image analysis and recognition. This article reviews the current state of this technology and its possible application to the more traditional problem-solving issues in optical character recognition (OCR) as well as those associated with other types of documents, such as manuscripts, particularly of a historical nature, and graphics. Firstly, we review the state of the art of the technology. We then describe two case studies of projects carried out at the UAB’s Computer Vision Centre that are of relevance to archival science: the massive analysis of administrative documents and of historical handwritten demographic documents.

    • français

      La vision par ordinateur désigne la discipline informatique qui permet de concevoir des algorithmes pour interpréter les images numériques. Lorsque les images correspondent à des documents numérisés, il s’agit de la sous-discipline de l’analyse et de la reconnaissance d’images de documents. Cet article est l’occasion de faire un état des lieux de la situation actuelle de cette technologie et de ses possibilités d’application, aussi bien en ce qui concerne la résolution des problèmes les plus courants en matière de reconnaissance optique de caractères (OCR) que de ceux associés à d’autres types de documents, dont, notamment, les manuscrits historiques et les graphiques. Tout d’abord, nous ferons le point sur les progrès technologiques. Nous décrirons ensuite deux cas pratiques de projets mis en œuvre dans le Centre de vision par ordinateur de l’Université autonome de Barcelone (UAB) et ayant une incidence dans le domaine de l’archivistique : l’analyse de masse des documents administratifs et des documents démographiques manuscrits historiques

    • català

      La visió per computador és la disciplina de la informàtica que s’encarrega de dissenyar algorismes que interpreten les imatges digitals. Quan les imatges corresponen a documents digitalitzats, estem en la subdisciplina de l’anàlisi i el reconeixement d’imatges de documents. En aquest article fem un repàs de la situació actual d’aquesta tecnologia i de les seves possibilitats d’aplicació en la resolució tant dels problemes més tradicionals de lectura òptica (ROC) com dels que estan associats a altres tipologies de documents com ara els manuscrits, especialment històrics, i els gràfics. En primer lloc, fem un repàs de l’estat de la qüestió de la tecnologia. A continuació, descrivim dos casos pràctics arran de projectes duts a terme al Centre de Visió per Computador de la UAB i de rellevància en l’àmbit arxivístic: l’anàlisi massiva de documents administratius i de documents demogràfics manuscrits històrics.

  • Referencias bibliográficas
    • J. Almazán, A. Gordo, A. Fornés, E. Valveny. «Word Spotting and Recognition with Embedded Attributes». IEEE Transactions on Pattern Analysis...
    • V. Alabau, L. Leiva. «Transcribing Handwritten Text Images With a Word Soup Game». Proceedings of Extended Abstracts on Human Factors in Computing...
    • N. Chen, D. A. Blostein. «A Survey of Document Image Classification: Problem Statement, Classifier Architecture and performance Evaluation»....
    • D. Doermann. «The Indexing and Retrieval of Document Images: A Survey». Computer Vision Image Understanding, 70(3), pp. 287-298, 1998.
    • S. Deerwester, S. Dumais, G. Furnas, T. Landauer, R. Harshman. «Indexing by Latent Semantic Analysis». Journal of the American Society for...
    • A. Fornés, J. Lladós, J. Mas, J. M. Pujades, A. Cabré. «A Bimodal Crowdsourcing Platform for Demographic Historical Manuscripts». Proceedings...
    • D. Fernández, S. Marinai, J. Lladós, A. Fornés. «Contextual Word Spotting in Historical Manuscripts Using Markov Logic Networks». Proceedings...
    • A. Gordo, A. Fornés, E. Valveny. «Writer Identifiation in Handwritten Musical Scores with Bags of Notes». Pattern Recognition, 46(5), pp....
    • A. Graves, M. Liwicki, S. Fernández, R. Bertolami, H. Bunke, J. Schmidhuber. «A Novel Connectionist System for Unconstrained Handwriting Recognition»....
    • P. Héroux, S. Diana, A. Ribert, E. Trupin. «Classification Method Study for Automatic Form Class Identifiation». Proceedings of the Fourteenth...
    • J. Mas, A. Fornés, J. Lladós. «An Interactive Transcription System of Census Records Using Word-Spotting Based Information Transfer»....
    • T. Plötz, G. A. Fink. «Markov Models for Of+ine Handwriting Recognition: A Survey». International Journal on Document Analysis and Recognition,...
    • V. Romero, A. Fornés, E. Vidal, J. A. Sánchez. «Using the MGGI Methodology for Category-based Language Modeling in Handwritten Marriage Licenses...
    • M. Rusiñol, D. Aldavert, R. Toledo, J. Lladós. «Efficient Segmentation-free Keyword Spotting in Historical Document Collections». Pattern...
    • M. Rusiñol, V. Frinken, D. Karatzas, A. D. Bagdanov, J. Lladós. «Multimodal Page Classification in Administrative Document Image Streams»....

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno