Ir al contenido

Documat


Resumen de Aspect-based sentiment analysis: A scalable system, a condition miner, and an evaluation dataset.

Fernando O. Gallego

  • español

    Los sistemas de análisis de sentimiento basados en aspectos son un tipo de sistemas de minería de texto que están especializados en resumir el sentimiento que una colección de revisiones transmite respecto a diversos aspectos de un item. En muchas ocasiones, los usuarios escriben sus revisiones utilizando condiciones; minarlas de manera que puedan ser analizadas es muy importante para mejorar la interpretación de los correspondientes suma- rios de sentimiento. Por desgracia, los sistemas comerciales y los sistemas académicos existentes ignoran las condiciones; los frameworks y bibliotecas existentes no proporcionan ningún componente para minarlas; además, las propuestas de la bibliografía son insuficientes ya que están basadas en patrones diseñados manualmente que no ofrecen suficiente cobertura o modelos de aprendizaje automático que están muy ligados a un idioma concreto y requieren de demasiada configuración específica. En esta tesis presentamos Torii, que es un sistema de análisis de sentimiento basado en aspectos cuya característica más destacada es que puede minar condiciones; también presentamos Kami, que proporciona dos propuestas de aprendizaje profundo para minar condiciones; finalmente presentamos Norito, que es el primer dataset de condiciones disponible públicamente. Nuestros resultados experimentales prueban que nuestras propuestas de minería de condiciones son similares al estado del arte en términos de precisión, pero mejoran la cobertura suficientemente como para batirlos en términos de F1. Finalmente, es digno de mención que esta tesis no habría sido posible sin la colaboración de Opileak, que garantiza la aplicabilidad industrial de nuestro trabajo.

  • English

    Aspect-based sentiment analysis systems are a kind of text-mining systems that specialise in summarising the sentiment that a collection of reviews convey regarding some aspects of an item. There are many cases in which users write their reviews using conditional sentences; in such cases, mining the conditions so that they can be analysed is very important to improve the interpretation of the corresponding sentiment summaries. Unfortunately, current commercial systems or research systems neglect conditions; current frameworks and toolkits do not provide any components to mine them; furthermore, the proposals in the literature are insufficient because they are based on hand-crafted patterns that fall short regarding recall or machine learning models that are tightly bound with a specific language and require too much configuration. In this dissertation, we introduce Torii, which is an aspect-based sentiment analysis system whose most salient feature is that it can mine conditions; we also introduce Kami, which provides two deep learning proposals to mine conditions; and we also present Norito, which is the first publicly available dataset of conditions. Our experimental results prove our proposals to mine conditions are similar to the state of the art in terms of precision, but improve recall enough to beat them in terms of F1 score. Finally, it is worth mentioning that this dissertation would not have been possible without the collaboration of Opileak, which backs up the industrial applicability of our work.


Fundación Dialnet

Mi Documat