Ir al contenido

Documat


Sentiment analysis in Arabic: opinion polarity detection

  • Autores: Mohammed Rushdi Saleh
  • Directores de la Tesis: María Teresa Martín Valdivia (dir. tes.) Árbol académico, Luis Alfonso Ureña López (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Jaén ( España ) en 2013
  • Idioma: inglés
  • ISBN: 9788484398554
  • Tribunal Calificador de la Tesis: Ruslan Mitkov (presid.) Árbol académico, José Manuel Perea Ortega (secret.) Árbol académico, José Antonio Troyano Jiménez (voc.) Árbol académico
  • Enlaces
    • Tesis en acceso abierto en: RUJA
  • Resumen
    • español

      El análisis de sentimientos está obteniendo una gran importancia debido al aumento de popularidad de la web 2.0. Esta memoria se centra en el estudio de diferentes aspectos del análisis de sentimientos. El primer objetivo es analizar las opiniones que provienen del árabe y predecir su polaridad. Para alcanzar este objetivo se han generado dos corpora: OCA y EVOCA. OCA es un corpus de opinión de películas en árabe, y EVOCA es un corpus paralelo a OCA que incluye la traducción al inglés de las opiniones. Otro objetivo consiste en el análisis de sentimientos adaptado a diferentes dominios. Para ello, se ha generado el corpus SINAI-SA y se han aplicado distintas técnicas de aprendizaje automático. Finalmente, en esta memoria se realiza un estudio sobre revisiones neutrales. Para llevar a cabo este objetivo, se han investigado dos enfoque principales, uno basado en orientación semántica y el otro basado en algoritmos de aprendizaje automático como SVM o NB.

    • English

      Sentiment analysis is becoming increasingly important due the growing popularity of Web 2.0. This study focuses mainly on how to analyze opinions in Arabic language and predict their polarity. To achieve that, two corpora have been generated (OCA and EVOCA), OCA is an opinion corpus for Arabic movie reviews, while EVOCA is the translated version of OCA to English. Another corpus was created (SINAI-SA corpus) used with other corpora in order to predict sentiments in different domains. SINAI corpus was also used to study how to sort comments behave as textual information for the prediction of customer rates. Another question that was solved in this study is “How to treat with the neutral reviews”. Two main approaches have been investigated in this research, one based on semantic orientation and the other one based on machine learning algorithms like SVM or NB


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno