Ir al contenido

Documat


Resumen de La visió per computador com a eina per a la interpretació automàtica de fonts documentals

Alicia Fornés Bisquerra Árbol académico, Josep Lladós Árbol académico, Oriol Ramos Terrades Árbol académico, Marçal Rusiñol Árbol académico

  • español

    La visión por computador es la disciplina informática que se encarga de diseñar algoritmos que interpretan las imágenes digitales. Cuando las imágenes corresponden a documentos digitalizados, nos encontramos en la subdisciplina del análisis y reconocimiento de imágenes de documentos. En este artículo hacemos un repaso de la situación actual de esta tecnología y de sus posibilidades de aplicación en la resolución tanto de los problemas más tradicionales de lectura óptica (ROC), como de los que están asociados a otras tipologías de documentos tales como los manuscritos, especialmente los históricos, y los gráficos. En primer lugar, hacemos un repaso del estado de la cuestión de la tecnología. A continuación describimos dos casos prácticos a raíz de proyectos llevados a cabo en el Centro de Visión por Computador de la UAB y de relevancia en el ámbito archivístico: el análisis masivo de documentos administrativos y de documentos demográficos históricos manuscritos.

  • English

    Computer vision is a discipline of Computer Science that designs algorithms that interpret digital images. When these images involve digitalized documents, we enter the subdiscipline of document image analysis and recognition. This article reviews the current state of this technology and its possible application to the more traditional problem-solving issues in optical character recognition (OCR) as well as those associated with other types of documents, such as manuscripts, particularly of a historical nature, and graphics. Firstly, we review the state of the art of the technology. We then describe two case studies of projects carried out at the UAB’s Computer Vision Centre that are of relevance to archival science: the massive analysis of administrative documents and of historical handwritten demographic documents.

  • français

    La vision par ordinateur désigne la discipline informatique qui permet de concevoir des algorithmes pour interpréter les images numériques. Lorsque les images correspondent à des documents numérisés, il s’agit de la sous-discipline de l’analyse et de la reconnaissance d’images de documents. Cet article est l’occasion de faire un état des lieux de la situation actuelle de cette technologie et de ses possibilités d’application, aussi bien en ce qui concerne la résolution des problèmes les plus courants en matière de reconnaissance optique de caractères (OCR) que de ceux associés à d’autres types de documents, dont, notamment, les manuscrits historiques et les graphiques. Tout d’abord, nous ferons le point sur les progrès technologiques. Nous décrirons ensuite deux cas pratiques de projets mis en œuvre dans le Centre de vision par ordinateur de l’Université autonome de Barcelone (UAB) et ayant une incidence dans le domaine de l’archivistique : l’analyse de masse des documents administratifs et des documents démographiques manuscrits historiques

  • català

    La visió per computador és la disciplina de la informàtica que s’encarrega de dissenyar algorismes que interpreten les imatges digitals. Quan les imatges corresponen a documents digitalitzats, estem en la subdisciplina de l’anàlisi i el reconeixement d’imatges de documents. En aquest article fem un repàs de la situació actual d’aquesta tecnologia i de les seves possibilitats d’aplicació en la resolució tant dels problemes més tradicionals de lectura òptica (ROC) com dels que estan associats a altres tipologies de documents com ara els manuscrits, especialment històrics, i els gràfics. En primer lloc, fem un repàs de l’estat de la qüestió de la tecnologia. A continuació, descrivim dos casos pràctics arran de projectes duts a terme al Centre de Visió per Computador de la UAB i de rellevància en l’àmbit arxivístic: l’anàlisi massiva de documents administratius i de documents demogràfics manuscrits històrics.


Fundación Dialnet

Mi Documat