Ir al contenido

Documat


Hacia una generación de resúmenes sin sesgo a partir de contenido generado por el usuario: Un enfoque preliminar

  • Autores: Alejandro Reyes, Elena Lloret Pastor Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 62, 2019, págs. 45-52
  • Idioma: español
  • Títulos paralelos:
    • Towards Unbiased Automatic Summarization from User Generated Content: A Preliminary Approach
  • Enlaces
  • Resumen
    • español

      En este trabajo se propone un enfoque novedoso de generación automática de resúmenes capaz de sintetizar grandes cantidades de información generada por diferentes tipos de usuarios en Internet y producir un nuevo texto coherente que presente la información de forma objetiva, es decir, evitando proporcionar información parcial o sesgada, a la par que aportando múltiples perspectivas sobre el tema en cuestión. En concreto, el escenario en el que se enmarca esta investigación es el ámbito turístico, centrándonos en las opiniones sobre distintos aspectos de varios hoteles proporcionadas por 5 tipos de perfil de usuario. La evaluación realizada con usuarios demuestra que i) la calidad de los resúmenes generados es adecuada y ii) que este tipo de resúmenes ayudaría a los usuarios a tomar mejores decisiones.

    • English

      In this paper a novel approach for automatic summarization is proposed. This approach is able to synthetize huge amounts of information generated by different types of users on the Internet and produce a new coherent text that presents the information in an objective way, i.e., avoiding biased information and giving multiple perspectives for an specific aspect/topic. This study is mainly focused on the tourism sector, especially on the opinions abour different topics existing in multiple hotels and given by 5 user types. The user evaluation conducted proves that i) the generated summaries have an appropriate quality, and ii) they would really help users to make better decisions.

  • Referencias bibliográficas
    • Bird, S. y E. Loper. 2004. NLTK: the natural language toolkit. En Proceedings of the ACL 2004 on Interactive poster and demonstration sessions,...
    • Denecke, K. 2009. Are SentiWordNet scores suited for multi-domain sentiment classification? En Proceedings of 4th International Conference...
    • Esteban, A. y E. Lloret. 2017a. Propuesta y desarrollo de una aproximaci´on de generaci´on de res´umenes abstractivos multig´enero. Procesamiento...
    • Esteban, A. y E. Lloret. 2017b. TravelSum: A spanish summarization application focused on the tourism sector. Procesamiento del Lenguaje Natural,...
    • Esuli, A. y F. Sebastiani. 2006. SentiWordNet: A publicly available lexical resource for opinion mining. En Proceedings of the 5th International...
    • Hovy, E. 2003. Text summarization. En The Oxford Handbook of Computational Linguistics 2nd edition. Oxford University Press.
    • Lloret, E. 2016. Introducing the key Stages for Addressing Multi-perspective Summarization. En Proceedings of the International Joint Conference...
    • Luo, C., Y. Lan, C. Wang, y L. Ma. 2013. The effect of information consistency and information aggregation on eWOM readers’ perception of...
    • McCarthy, D. y R. Navigli. 2007. Word sense disambiguation: An overview. Proceedings of the 4th International Workshop on Semantic Evaluations,...
    • Miller, G. 1998. WordNet: An electronic lexical database. MIT press.
    • Paulus, R., C. Xiong, y R. Socher. 2017. A deep reinforced model for abstractive summarization. arXiv preprint arXiv:1705.04304.
    • Pennington, J., R. Socher, y C. D. Manning. 2014. Glove: Global vectors for word representation. En Proceedings of Empirical Methods in Natural...
    • Rehurek, R. y P. Sojka. 2010. Software Framework for Topic Modelling with Large Corpora. En Proceedings of the LREC Workshop on New Challenges...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno