Uso de grafos de conceptos para la generación automática de resumenes en biomedicina

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/8578
Información del item - Informació de l'item - Item information
Título: Uso de grafos de conceptos para la generación automática de resumenes en biomedicina
Título alternativo: Concept-graphs based biomedical automatic summarization using UMLS
Autor/es: Plaza Morales, Laura | Díaz Esteban, Alberto | Gervás Gómez-Navarro, Pablo
Palabras clave: Generación automática de resúmenes | Unified Medical Language System (UMLS) | Redes libres de escala | Artículo biomédico | Ontología | Automatic summarization | Degree-based methods | Scale-free network | Biomedical article | Ontology
Fecha de publicación: sep-2008
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: PLAZA MORALES, Laura; DÍAZ ESTEBAN, Alberto; GERVÁS GÓMEZ-NAVARRO, Pablo. “Uso de grafos de conceptos para la generación automática de resumenes en biomedicina”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 191-198
Resumen: Uno de los principales problemas en la investigación sobre generación automática de resúmenes (GAR) es la falta de utilización de conocimiento de dominio, que se refleja en la incorrecta interpretación semántica del documento y la baja calidad de los resúmenes obtenidos. En este trabajo se propone un método de extracción de oraciones para la GAR de artículos biomédicos, mediante el mapeo del documento a los conceptos de la ontología UMLS, y la representación del documento y de sus oraciones como grafos. La selección de las oraciones relevantes se realiza a partir de la conectividad de los conceptos que contienen en el grafo del documento. Se muestran los resultados empíricos preliminares de la aplicación de distintas heurísticas para la selección de las oraciones del resumen, y se identifican algunos problemas y líneas de trabajo futuras. | One of the main problems in research on automatic summarization is the inaccurate semantic interpretation of the source, which is reflected in the deficiencies shown by the resulting summaries. Using specific domain knowledge, as that supplied by ontologies, can considerably alleviate the problem. In this paper, we introduce an ontology-based extractive method for summarization. It is based on mapping the text to concepts in the ontology and representing the document as a scale-free graph. To assess the importance of the sentences we compute the centrality of their concepts in the text. We have applied our approach to summarize scientific biomedical literature, taking advantage from free resources as UMLS. Preliminary empirical results are presented and pending problems are identified.
Patrocinador/es: Esta investigación está financiada por el Ministerio de Educación y Ciencia (TIN2006-14433-C02-01) y la Universidad Complutense de Madrid y la Dirección General de Universidades e Investigación de la Comunidad Autónoma de Madrid (CCG07-UCM/TIC- 2803).
URI: http://hdl.handle.net/10045/8578
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_41_23.pdf453,81 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.