Ir al contenido

Documat


Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos

  • Autores: Yamel Pérez Guadarramas, Aramis Rodríguez Blanco, Alfredo J. Simón Cuevas, Wenny Hojas Mazo, José Ángel Olivas Varela Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 59, 2017, págs. 39-46
  • Idioma: español
  • Títulos paralelos:
    • Combining lexical-syntactic patterns and topic analysis for automatic keyphrase extraction from texts
  • Enlaces
  • Resumen
    • español

      La extracción automática de frases relevantes constituye una tarea de gran importancia para muchas soluciones computacionales en el área del procesamiento de lenguaje natural y la minería de texto. En este trabajo se propone un nuevo método no supervisado para la extracción de frases relevantes en textos, en el cual se combina el uso de patrones léxico-sintácticos con una estrategia de análisis de tópicos basada en grafo. El método fue evaluado con los corpus SemEval-2010 e INSPEC y comparado con otras propuestas del estado del arte, obteniéndose resultados muy prometedores.

    • English

      The automatic keyphrases extraction is a useful task for many computational solutions in the natural language processing and text mining areas. In this paper, a new unsupervised method for keyphrase extraction from texts is proposed, in which the use of lexical-syntactic patterns is combined with a graph-based topic analysis strategy. The method was evaluated with the SemEval-2010 and INSPEC corpus, and compared with other state-of-the-art proposals, obtaining promising results.

  • Referencias bibliográficas
    • Brin, S., y L. Page. 1998. The anatomy of a large-scale hypertextual Web search engine. Comput. Netw. ISDN Syst. 30(1-7):107– 117.
    • Bougouin, A., F. Boudin, y B. Daille. 2013. TopicRank: Graph-Based Topic Ranking for Keyphrase Extraction. En Proceedings of 6th Int. Joint...
    • Chang, J. Y., y I. M. Kim. 2014. Research Trends on Graph-Based Text Mining. Int. Journal of Software Engineering and Its Applications, 8(4):37-50.
    • Grineva, M., Grinev, y D., Lizorkin. 2009. Extracting Key Terms From Noisy and Multi-theme Documents. En Proceedings of the 18th Int. Conf....
    • Hasan, K. S. y V. Ng. 2014. Automatic Keyphrase Extraction: A Survey of the State of the Art. En Proceedings of the 52nd Annual Meeting of...
    • Hulth, A. 2003. Improved Automatic Keyword Extraction Given More Linguistic Knowledge. En Proceedings of the 2003 Conf. on Empirical Methods...
    • Kim, S. N., O. Medelyan, M. Y. Kan, y T. Baldwin. 2010. SemEval-2010 Task 5: Automatic Keyphrase Extraction from Scientific Articles. En Proceedings...
    • Liu, Z., P. Li, Y. Zheng, y M., Sun. 2009. Clustering to Find Exemplar Terms for Keyphrase Extraction. En Proceedings of the 2009 Conf. on...
    • Lehmann, J., R. Isele, M. Jakob, A. Jentzsch, D. Kontokostas, P. N. Mendes, S. Hellmann, M. Morsey, P. van Kleef, S. Auer, y C. Bizer. 2012....
    • López, P., y L. Romary. 2010. HUMB: Automatic Key Term Extraction from Scientific Articles in GROBID. En Proceedings of the 5th Int. Workshop...
    • Martínez, J., L. Araujo, y A. D. Fernández. 2016. SemGraph: Extracting Keyphrases Following a Novel Semantic Graph-Based Approach. Journal...
    • Merrouni, Z. A., B. Frikh, y B. Ouhbi. 2016. Automatic Keyphrase Extraction: An Overview Of The State Of The Art. En Proceedings of the 4th...
    • Mihalcea, R., y P. Tarau. 2004. TextRank: Bringing Order into Texts. En Proceedings of the 2004 Conf. on Empirical Methods in NLP. páginas...
    • Müllner, D. 2011. Modern hierarchical, agglomerative clustering algorithms. CoRR, abs/1109.2378.
    • Rodríguez, A., y A. Simón. 2013. Método para la extracción de información estructurada desde textos. RCCI, 7(1): 55-67.
    • Samhaa, R. El-B. y A. Rafea. 2010. KP-Miner: Participation in SemEval-2. En Proceedings of the 5th Int. Workshop on Semantic Evaluation (SemEval...
    • Thi, T., M. L. Nguyen, y A. Shimazu. 2016. Unsupervised Keyphrase Extraction: Introducing New Kinds of Words to Keyphrases. AI'16, LNCS...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno