En este artculo se describe un sistema para la clasi cacion de la polaridad de tuits escritos en espa~nol. Se adopta una aproximacion hbrida, que combina conocimiento lingustico obtenido mediante pln con tecnicas de aprendizaje autom atico. Como paso previo, se realiza una primera etapa de preprocesado para tratar ciertas caractersticas del uso del lenguaje en Twitter. A continuacion se extrae informacion morfologica, sintactica y semantica, para utilizarla posteriormente como entrada a un clasi cador supervisado. La evaluacion de la propuesta se lleva a cabo sobre el corpus tass 2012, anotado para realizar tareas de clasi cacion con cuatro y seis categoras. Los resultados experimentales muestran un buen rendimiento para ambos casos, lo que valida la utilidad practica de la propuesta
This article describes a system that classi es the polarity of Spanish tweets. We adopt a hybrid approach, which combines linguistic knowledge acquired by means of nlp with machine learning techniques. We carry out a preprocessing of the tweets as an initial step to address some characteristics of the language used in Twitter. Then, we apply part-of-speech tagging, dependency parsing and extraction of semantic knowledge, and we employ all that information as features for a supervised classi er. We have evaluated our proposal with the tass 2012 corpus, which is annotated to undertake classi cation tasks with four and six categories.
Experimental results are good in both cases and con rm the practical utility of the approach.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados