Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/69113
Información del item - Informació de l'item - Item information
Título: Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos
Título alternativo: Combining lexical-syntactic patterns and topic analysis for automatic keyphrase extraction from texts
Autor/es: Pérez-Guadarramas, Yamel | Rodríguez-Blanco, Aramis | Simón-Cuevas, Alfredo | Hojas-Mazo, Wenny | Olivas, José Ángel
Palabras clave: Extracción automática de frases relevantes | Minería de texto | Procesamiento de lenguaje natural | Automatic keyphrase extraction | Text mining | Natural language processing
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2017
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2017, 59: 39-46
Resumen: La extracción automática de frases relevantes constituye una tarea de gran importancia para muchas soluciones computacionales en el área del procesamiento de lenguaje natural y la minería de texto. En este trabajo se propone un nuevo método no supervisado para la extracción de frases relevantes en textos, en el cual se combina el uso de patrones léxico-sintácticos con una estrategia de análisis de tópicos basada en grafo. El método fue evaluado con los corpus SemEval-2010 e INSPEC y comparado con otras propuestas del estado del arte, obteniéndose resultados muy prometedores. | The automatic keyphrases extraction is a useful task for many computational solutions in the natural language processing and text mining areas. In this paper, a new unsupervised method for keyphrase extraction from texts is proposed, in which the use of lexical-syntactic patterns is combined with a graph-based topic analysis strategy. The method was evaluated with the SemEval-2010 and INSPEC corpus, and compared with other state-of-the-art proposals, obtaining promising results.
Patrocinador/es: Este trabajo ha sido parcialmente financiado por el proyecto METODOS RIGUROSOS PARA EL INTERNET DEL FUTURO (MERINET), financiado por el Fondo Europeo de Desarrollo Regional (FEDER) y el Ministerio de Economía y Competitividad (MINECO), Ref. TIN2016-76843-C4-2-R.
URI: http://hdl.handle.net/10045/69113
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 59 (2017)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_59_04.pdf1,32 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.