Yunior Ramírez Cruz, Rafael Berlanga , Reynaldo Gil-García
En este artculo presentamos un marco para la obtencion de representa- ciones condensadas estructuralmente complejas de conjuntos de documentos, el cual servira de base para la construccion de resumenes, la obtencion de respuestas para preguntas complejas, etc. Este marco incluye un metodo para extraer una lista ordenada de hechos, triplos de la forma entidad - relacion - entidad, el cual usa patrones de extraccion basados en analisis de dependencias y modelos de lenguajes;
y metodos para construir un grafo bipartito que codi que la informacion contenida en el conjunto de hechos y determinar un orden de recorrido apropiado sobre dicha estructura. Evaluamos los componentes de nuestro marco sobre una subcoleccion extrada de MEDLINE. Los resultados obtenidos son prometedores.
In this paper, we present a framework for obtaining structurally complex condensed representations of documents sets, which will be used as a base for sum- marization, answering complex questions, etc. This framework includes a method for extracting a ranked list of facts, triples of the form entity - relation - entity, which relies on dependency parsing-based extraction patterns and language modeling; and methods for constructing a bipartite graph encoding the information contained in the set of facts and determining an appropriate traversing order on that structure.
We evaluate the components of our framework on a subcollection extracted from MEDLINE, obtaining promising results.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados