Ir al contenido

Documat


Aplicación de técnicas de extracción de información en bibliotecas digitales

  • Autores: Alejandro Bia Platas Árbol académico, Rafael Muñoz Guillena Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 26, 2000, págs. 207-214
  • Idioma: español
  • Enlaces
  • Resumen
    • Con frecuencia, las Bibliotecas Digitales tienen la necesidad de extraer información a partir de documentos pobremente marcados para almacenarla en bases de datos o crear nuevos documentos hipertexto con un marcado altamente estructurado. En este trabajo, abordaremos el problema de extraer información bibliográfica a partir de informes literarios en formato HTML para alimentar una base de datos de publicaciones gallegas de una Biblioteca Digital para ser consultada a través de Internet. Para este fin se ha utilizado con éxito una metodología que aprovecha la información contenida en las marcas HTML y que a su vez aplica técnicas de Procesamiento del Lenguaje Natural (PLN).


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno