Ir al contenido

Documat


Extracción de información temporal de la DBpedia: Propuesta de integración en un corpus semiestructurado

  • Autores: Ana M. García Serrano Árbol académico, Ángel Castellanos, Adolfo Merás
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 58, 2017, págs. 117-124
  • Idioma: español
  • Títulos paralelos:
    • Extraction of temporal information of the DBpedia: Integration proposal in a semi-structured corpus
  • Enlaces
  • Resumen
    • español

      En este trabajo, se hace una propuesta para la extracción automática de información temporal en la DBpedia, suficientemente general para ser aplicada a diferentes dominios. Se experimenta en un dominio concreto, para el que se identificarán y gestionarán recursos DBpedia relacionados. Con la información temporal extraída de los recursos, se alimentará una línea de tiempo y se intersecará a su vez con la información temporal extraída del dominio, en este caso del corpus DIMH (textos semiestructurados o fichas). A continuación, se enriquecerán las fichas originales con la información temporal y se visualizarán y accederá a los resultados organizados sobre la base de su dimensión léxica y temporal. Ante la ausencia de un gold standard para evaluar intrínsecamente la propuesta, se aplican criterios dependientes del dominio y de los usuarios y se pone a disposición de la comunidad científica (GitHub) el corpus anotado temporalmente.

    • English

      The goal of this work is to make a proposal for the automatic extraction of temporal information in the DBpedia, general enough to be applied to different domains. The experiment is performed using a concrete domain by the identification and management of domain related DBpedia resources. With the relevant temporal information extracted from the resources it will be feed a timeline and intersected with the temporal information of the DIMH corpus (semi-structured texts or cards). Thus, we will enrich these cards with related events of the timeline. In order to visualize the results, we are using a graphical interface to facilitate the lexical and the temporal information access. In the absence of a gold standard to intrinsically evaluate the proposal, it will be applied domain and users dependent criteria and the annotated corpus is made available to the scientific community (GitHub).

  • Referencias bibliográficas

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno