Using semantic graphs and word sense disambiguation techniques to improve text summarization

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/18517
Información del item - Informació de l'item - Item information
Título: Using semantic graphs and word sense disambiguation techniques to improve text summarization
Título alternativo: Uso de grafos semánticos y de técnicas de desambiguación en la generación automática de resúmenes
Autor/es: Plaza Morales, Laura | Díaz Esteban, Alberto
Palabras clave: Generación automática de resúmenes | Grafos semánticos | Desambiguación léxica y semántica | Agrupamiento de conceptos | Automatic summarization | Semantic graphs | Word sense disambiguation | Concept clustering
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2011
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: PLAZA, Laura; DÍAZ, Alberto. “Using semantic graphs and word sense disambiguation techniques to improve text summarization”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 97-105
Resumen: En este trabajo se presenta un método para la generación automática de resúmenes basado en grafos semánticos. El sistema utiliza conceptos y relaciones de WordNet para construir un grafo que representa el documento, así como un algoritmo de clustering basado en la conectividad para descubrir los distintos temas tratados en él. La selección de oraciones para el resumen se realiza en función de la presencia en las oraciones de los conceptos más representativos del documento. Los experimentos realizados demuestran que el enfoque propuesto obtiene resultados significativamente mejores que otros sistemas evaluados bajo las mismas condiciones experimentales. Asimismo, el sistema puede ser fácilmente adaptado para trabajar con documentos de diferentes dominios, sin más que modificar la base de conocimiento y el método para identificar conceptos en el texto. Finalmente, este trabajo también estudia el efecto de la ambigüedad léxica en la generación de resúmenes. | This paper presents a semantic graph-based method for extractive summarization. The summarizer uses WordNet concepts and relations to produce a semantic graph that represents the document, and a degree-based clustering algorithm is used to discover different themes or topics within the text. The selection of sentences for the summary is based on the presence in them of the most representative concepts for each topic. The method has proven to be an efficient approach to the identification of salient concepts and topics in free text. In a test on the DUC data for single document summarization, our system achieves significantly better results than previous approaches based on terms and mere syntactic information. Besides, the system can be easily ported to other domains, as it only requires modifying the knowledge base and the method for concept annotation. In addition, we address the problem of word ambiguity in semantic approaches to automatic summarization.
URI: http://hdl.handle.net/10045/18517
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 47 (2011)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_47_10.pdf577,78 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.