Ir al contenido

Documat


Indexación y reconocimiento automático de texto manuscrito

  • Autores: Celio Hernández Tornero, Verónica Romero Gómez, Joan Andreu Sánchez, Alejandro Hector Toselli Rossi Árbol académico, Enrique Vidal Ruiz Árbol académico
  • Localización: Cuadernos AISPI: Estudios de lenguas y literaturas hispánicas, ISSN 2283-981X, Nº. 11, 2018 (Ejemplar dedicado a: Arte novísimo de estudiar comedias: las Humanidades Digitales y el teatro áureo), págs. 131-146
  • Idioma: español
  • DOI: 10.14672/0.2018.1432
  • Títulos paralelos:
    • Indexing and automatic recognition of handwritten text
  • Enlaces
  • Resumen
    • español

      Se especula que la cantidad de texto manuscrito acumulado en documentos custodiados por bibliotecas y archivos alrededor del mundo, supera ampliamente a la cantidad de texto (original) impreso o mecanografiado existente hasta la actualidad. Solo una pequeñísima fracción de esta ingente cantidad de documentos ha sido digitalizada hasta el momento, y de ella solo una parte infinitesimal ha sido transcrita. Así pues, la información de mayor interés contenida en la inmensa mayoría de imágenes digitales (es decir, la información transmitida por el texto), continúa siendo inaccesible para su fácil lectura, edición, indexación y búsqueda. En este artículo se introducen proyectos, y soluciones efectivas recientemente desarrolladas en ellos, para la búsqueda de información y para la transcripción completa de imágenes de documentos manuscritos históricos.

    • English

      It is speculated that the amount of manuscripts accumulated in libraries and archives around the world far exceeds the amount of (original) text printed or typed to the present. Just a small amount of these documents has been digitized so far, and only part of it has been transcribed. Therefore, the most interesting information contained in the vast majority of digital images (i.e., the information transmitted by the text), remains inaccessible for easy reading, editing, indexing and search. In this article, projects and effective solutions recently developed within their frameworks are presented, both for the search of information and for the complete transcription of historical handwritten documents.

  • Referencias bibliográficas
    • Rashad; Al-Khatif, Wasfi G.; Mahmoud, Sabri (2017), “A survey on handwritten documents word spotting”, International Journal of Multimedia...
    • Bluche, Théodore (2015), Deep Neural Networks for Large Vocabulary Handwritten Text Recognition, Tesis doctoral, Université Paris Sud -...
    • Bluche, Théodore; Hamel, Sebastien; Kermovant, Christopher; Puigcerver, Joan; Stutzmann, Dominique; Toselli, Alejandro; Vidal, Enrique (2017),...
    • Dempster, A.P.; Laird, N.M.; Rubin, D.B. (1977) “Maximum likelihood from incomplete data via the EM algorithm (with discussion)”, Journal...
    • Fiel, Stefan; Grüning, Tobias; Gatos, Basilis; Dien, Markus; Kleber, Florian (2017), “cBAD: ICDAR 2017 competition on baseline detection”,...
    • Fischer, A.; Keller, A.; Frinken, V; Bunke, H. (2010), “Lexicon-free handwritten word spotting using character HMMs”, Pattern Recognition...
    • Frinken, V; Fischer, A; Manmatha, R; Bunke, H. (2012), “A Novel Word Spotting Method Based on Recurrent Neural Networks”, IEEE Transactions...
    • Giotis, Angelos P.; Sfikas, Giorgos; Gatos, Basilis; Nikou, Christophoros (2017), “A survey of document image word spotting techniques”, Pattern...
    • Graves, A.; Liwicki, M.; Fernández, S.; Bertolami, R.; Bunke, H.; Schmidhuber, J. (2009), “A novel connectionist system for unconstrained...
    • Jelinek, Frederick (1998), Statistical Methods for Speech Recognition, Cambridge (Mass.), MIT Press.
    • Kim, G.; Govindaraju, V.; Srihari, S.N. (1999), “An architecture for handwritten text recognition systems”, International Journal on Document...
    • Makhoul, J.; Schwartz, R.; Lapre, C.; Bazzi, I. (1998), “A script-independent methodology for optical character recognition”, Pattern Recognition,...
    • Pastor i Gadea, Moisés (2007), Aportaciones al reconocimiento automático de texto manuscrito, Tesis doctoral, Universitat Politècnica de València.
    • Plamondon, R.; Srihari, S.N. (2000), “On-line and off-line handwriting recognition: a comprehensive survey”, IEEE Transactions on Pattern...
    • Pratikakis, I.; Zagoris, K.; Gatos, B.; Puigcerver, Joan; Toselli, Alejandro H.; Vidal, Enrique (2016), “ICFHR2016 handwritten keyword spotting...
    • Puigcerver, Joan; Toselli, Alejandro H.; Vidal, Enrique (2015), “ICDAR2015 competition on keyword spotting for handwritten documents”, Document...
    • Romero, Verónica; Toselli, Alejandro H.; Vidal, Enrique (2012), Multimodal Interactive Handwritten Text Transcription, Machine Perception...
    • Sánchez, Joan Andreu; Romero, Verónica; Toselli, Alejandro H.; Vidal, Enrique (2014), “ICFHR2014 competition on handwritten text recognition...
    • —, (2015), “ICDAR 2015 competition HTRtS: Handwritten text recognition on the tranScriptorium dataset”, 13th International Conference on Document...
    • Steinherz, T; Rivlin, E.; Intrator, N. (1999), “Off-line cursive script word recognition-a survey”, International Journal on Document Analysis...
    • Toselli, Alejandro H; Romero, Verónica; Pastor i Gadea, M.; Vidal, E (2010), “Multimodal interactive transcription of text images”, Pattern...
    • Toselli, Alejandro H; Vidal, Enrique; Casacuberta, Francisco (2011), Multimodal Interactive Pattern Recognition and Applications, Springer.
    • Toselli, Alejandro H; Vidal, Enrique; Romero, Verónica; Frinken, Volkmar (2016), “HMM word graph based keyword spotting in handwritten document...
    • Toselli, Alejandro H; Leiva, Luis A.; Bordes-Cabrera, Isabel; Hernández-Tornero, Celio; Bosch, Vicent; Vidal, Enrique (2017), “Transcribing...
    • Toselli, Alejandro H; Vidal, Enrique (2013), “Fast HMM-Filler approach for Key Word Spotting in Handwritten Documents”, 12th International...
    • Vidal, Enrique (2017), “Advances in handwritten keyword indexing and search technologies”, Codicology and Palaeography in the Digital Age...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno