Generación de resúmenes extractivos de múltiples documentos usando grafos semánticos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/96600
Información del item - Informació de l'item - Item information
Título: Generación de resúmenes extractivos de múltiples documentos usando grafos semánticos
Título alternativo: Multi-document extractive summarization using semantic graph
Autor/es: Camino Valle, Oleyda del | Simón-Cuevas, Alfredo | Valladares-Valdés, Eduardo | Olivas, José Ángel | Romero, Francisco P.
Palabras clave: Generación de resúmenes multi-documentos | Grafos semánticos | Desambiguación | Agrupamiento de conceptos | Multi-document summarization | Semantic graph | Word sense disambiguation | Concept clustering
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2019, 63: 103-110. doi:10.26342/2019-63-11
Resumen: La generación automática de resúmenes consiste en sintetizar en un texto corto la información más relevante contenida en documentos, y permite reducir los problemas generados por la sobrecarga de información. En este trabajo se presenta un método no supervisado de generación de resúmenes extractivos a partir de múltiples documentos. En esta propuesta, la conceptualización y estructura semántica subyacente del contenido textual se representa en un grafo semántico usando WordNet y se aplica un algoritmo de agrupamiento de conceptos para identificar los tópicos tratados en los documentos, con los cuales se evalúa la relevancia de las oraciones para construir el resumen. El método fue evaluado con corpus de textos de MultiLing 2015, y se usaron métricas de ROUGE para medir la calidad de los resúmenes generados. Los resultados obtenidos se compararon con los de otros sistemas participantes en MultiLing 2015, evidenciándose mejoras en la mayoría de los casos. | The automatic texts summarization consists in synthesizing in a short text the most relevant information contained in text documents, and allows to reduce the generated problems by the information overload. In this paper, an unsupervised method for extractive multi-document summarization is presented. In this proposal, the conceptualization and underlying semantics structure of the textual content is represented in a semantic graph using WordNet, and a concept clustering algorithm is applied to identifying the topics of the documents set, with which the relevance of the sentences is evaluated to build the summary. The method was evaluated with texts corpus from MultiLing 2015, and ROUGE metrics were used to measure the quality of the generated summaries. The obtained results were compared with those other participant systems in MultiLing 2015, evidencing improves in most of the cases.
Patrocinador/es: Este trabajo ha sido parcialmente soportado por el Fondo Europeo de Desarrollo Regional (FEDER) y el Ministerio Español de Economía y Competitividad, bajo la subvención del proyecto METODOS RIGUROSOS PARA EL INTERNET DEL FUTURO (MERINET) Ref. TIN2016-76843-C4-2-R (AEI/FEDER, UE).
URI: http://hdl.handle.net/10045/96600
ISSN: 1135-5948
DOI: 10.26342/2019-63-11
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2019-63-11
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_63_11.pdf893,33 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.