Ir al contenido

Documat


A frame work for obtaining structurally complex condensed representations of document sets in the biomedical domain

  • Autores: Yunior Ramírez Cruz, Rafael Berlanga Árbol académico, Reynaldo Gil-García
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 49, 2012, págs. 21-28
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      En este artculo presentamos un marco para la obtencion de representa- ciones condensadas estructuralmente complejas de conjuntos de documentos, el cual servira de base para la construccion de resumenes, la obtencion de respuestas para preguntas complejas, etc. Este marco incluye un metodo para extraer una lista ordenada de hechos, triplos de la forma entidad - relacion - entidad, el cual usa patrones de extraccion basados en analisis de dependencias y modelos de lenguajes;

      y metodos para construir un grafo bipartito que codi que la informacion contenida en el conjunto de hechos y determinar un orden de recorrido apropiado sobre dicha estructura. Evaluamos los componentes de nuestro marco sobre una subcoleccion extrada de MEDLINE. Los resultados obtenidos son prometedores.

    • English

      In this paper, we present a framework for obtaining structurally complex condensed representations of documents sets, which will be used as a base for sum- marization, answering complex questions, etc. This framework includes a method for extracting a ranked list of facts, triples of the form entity - relation - entity, which relies on dependency parsing-based extraction patterns and language modeling; and methods for constructing a bipartite graph encoding the information contained in the set of facts and determining an appropriate traversing order on that structure.

      We evaluate the components of our framework on a subcollection extracted from MEDLINE, obtaining promising results.

  • Referencias bibliográficas
    • Bodenreider, O.: 2006. Lexical, Terminological, and Ontological Resources for Biological Text Mining. In Text Mining for Biology and Biomedicine....
    • Filatova, E. and V. Hatzivassiloglou: 2003. Domain-Independent Detection, Extraction, and Labeling of Atomic Events. In Proceedings of RANLP...
    • Filatova, E. and V. Hatzivassiloglou: 2004. Event-Based Extractive Summarization. In Proceedings of the ACL 2004 Workshop\Text Summarization...
    • Klein, D. and C. D. Manning: 2003. Accurate Unlexicalized Parsing. Proceedings of the 41st Meeting of the Association for Computational Linguistics,...
    • de Marneffe, M. C., B. MacCartney and C. D. Manning: 2006. Generating Typed Dependency Parses from Phrase Structure Parses. In Proceedings...
    • Mihalcea, R.: 2004. Graph-based ranking algorithms for sentence extraction, applied to text summarization. Proceedings of the ACL 2004 Interactive...
    • Miller G. A.: 1995. WordNet: a Lexical Database for English. Communications of the ACM, 38(11): 39-41.

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno