A framework for obtaining structurally complex condensed representations of document sets in the biomedical domain

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/23916
Información del item - Informació de l'item - Item information
Título: A framework for obtaining structurally complex condensed representations of document sets in the biomedical domain
Título alternativo: Un marco para la obtención de representaciones condensadas estructuralmente complejas de conjuntos de documentos en el dominio biomédico
Autor/es: Ramírez Cruz, Yunior | Berlanga Llavori, Rafael | Gil García, Reynaldo
Palabras clave: Minería de textos | Recuperación y extracción de información | Aplicaciones biomédicas | Text mining | Information retrieval and extraction | Biomedical applications
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2012
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: RAMÍREZ-CRUZ, Yunior; BERLANGA-LLAVORI, Rafael; GIL-GARCÍA, Reynaldo. “A framework for obtaining structurally complex condensed representations of document sets in the biomedical domain”. Procesamiento del Lenguaje Natural. N. 49 (2012). ISSN 1135-5948, pp. 21-28
Resumen: En este artículo presentamos un marco para la obtención de representaciones condensadas estructuralmente complejas de conjuntos de documentos, el cual servirá de base para la construcción de resúmenes, la obtención de respuestas para preguntas complejas, etc. Este marco incluye un método para extraer una lista ordenada de hechos, triplos de la forma entidad - relación - entidad, el cual usa patrones de extracción basados en análisis de dependencias y modelos de lenguajes; y métodos para construir un grafo bipartito que codifique la información contenida en el conjunto de hechos y determinar un orden de recorrido apropiado sobre dicha estructura. Evaluamos los componentes de nuestro marco sobre una subcolección extraída de MEDLINE. Los resultados obtenidos son prometedores. | In this paper, we present a framework for obtaining structurally complex condensed representations of documents sets, which will be used as a base for summarization, answering complex questions, etc. This framework includes a method for extracting a ranked list of facts, triples of the form entity - relation - entity, which relies on dependency parsing-based extraction patterns and language modeling; and methods for constructing a bipartite graph encoding the information contained in the set of facts and determining an appropriate traversing order on that structure. We evaluate the components of our framework on a subcollection extracted from MEDLINE, obtaining promising results.
URI: http://hdl.handle.net/10045/23916
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 49 (2012)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_49_02.pdf410,38 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.