Ir al contenido

Documat


Resumen de Experiments on feature replacements for polarity classification of Spanish tweets

José Manuel Perea Ortega Árbol académico, Alexandra Balahur Dobrescu Árbol académico

  • español

    En este artículo presentamos varios experimentos para abordar la tarea de la clasificación global de la polaridad de tweets en español. Estos experimentos se han centrado en diferentes sustituciones de características llevadas a cabo para ambos conjuntos de datos proporcionados, tanto de desarrollo como de test. Las sustituciones realizadas se basaron principalmente en los signos de puntuación re- petidos, los emoticonos y las palabras de opinión, mediante el uso de un diccionario construido para análisis de sentimientos. A continuación, se aplicó un enfoque basa- do en aprendizaje automático para obtener la polaridad de los tweets. Los resultados obtenidos muestran que las estrategias hibridas propuestas mejoran la precisión en la clasificación de la polaridad de los sentimientos expresados en tweets en compa- ración con el uso de caracteristicas basadas solo en n-gramas.

  • English

    In this paper we present several experiments to address the global po- larity classification task of Spanish tweets. These experiments have focused on dif- ferent feature replacements carried out for both the development and test data sets provided. The replacements performed were mainly based on repeated punctuation signs, emoticons and affect words, by using an in-house built dictionary for senti- ment analysis. Then, a machine learning approach was applied to get the polarity of the tweets. The results obtained show that the hybrid approaches proposed improve sentiment polarity classification when compared to simple n-gram feature use.


Fundación Dialnet

Mi Documat