A framework for obtaining structurally complex condensed representations of document sets in the biomedical domain
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/23916
Título: | A framework for obtaining structurally complex condensed representations of document sets in the biomedical domain |
---|---|
Título alternativo: | Un marco para la obtención de representaciones condensadas estructuralmente complejas de conjuntos de documentos en el dominio biomédico |
Autor/es: | Ramírez Cruz, Yunior | Berlanga Llavori, Rafael | Gil García, Reynaldo |
Palabras clave: | Minería de textos | Recuperación y extracción de información | Aplicaciones biomédicas | Text mining | Information retrieval and extraction | Biomedical applications |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2012 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | RAMÍREZ-CRUZ, Yunior; BERLANGA-LLAVORI, Rafael; GIL-GARCÍA, Reynaldo. “A framework for obtaining structurally complex condensed representations of document sets in the biomedical domain”. Procesamiento del Lenguaje Natural. N. 49 (2012). ISSN 1135-5948, pp. 21-28 |
Resumen: | En este artículo presentamos un marco para la obtención de representaciones condensadas estructuralmente complejas de conjuntos de documentos, el cual servirá de base para la construcción de resúmenes, la obtención de respuestas para preguntas complejas, etc. Este marco incluye un método para extraer una lista ordenada de hechos, triplos de la forma entidad - relación - entidad, el cual usa patrones de extracción basados en análisis de dependencias y modelos de lenguajes; y métodos para construir un grafo bipartito que codifique la información contenida en el conjunto de hechos y determinar un orden de recorrido apropiado sobre dicha estructura. Evaluamos los componentes de nuestro marco sobre una subcolección extraída de MEDLINE. Los resultados obtenidos son prometedores. | In this paper, we present a framework for obtaining structurally complex condensed representations of documents sets, which will be used as a base for summarization, answering complex questions, etc. This framework includes a method for extracting a ranked list of facts, triples of the form entity - relation - entity, which relies on dependency parsing-based extraction patterns and language modeling; and methods for constructing a bipartite graph encoding the information contained in the set of facts and determining an appropriate traversing order on that structure. We evaluate the components of our framework on a subcollection extracted from MEDLINE, obtaining promising results. |
URI: | http://hdl.handle.net/10045/23916 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 49 (2012) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_49_02.pdf | 410,38 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.