En este trabajo presentamos un conjunto de lexicones de polaridades semánticas a nivel de lemas para inglés, español, catalán, gallego y euskera. Estos lexicones están estructurados en capas, lo que permite seleccionar distintos compromisos entre la cantidad de estimaciones de positividad y negatividad y la precisión de dichas estimaciones. Los lexicones se han generado automáticamente a partir de una mejora del método utilizado para generar SentiWordNet, un recurso ampliamente utilizado que recoge estimaciones de positividad y negatividad a nivel de synsets. Nuestras evaluaciones sobre los lexicones para inglés y español muestran altos niveles de precisión en todas las capas. El recurso que contiene todos los lexicones obtenidos, llamado ML-SentiCon, está disponible de forma pública para su uso.
In this work, we present a set of lemma-level sentiment lexicons for English, Spanish, Catalan, Basque and Galician. These lexicons are layered, allowing to trade off between the amount of available words and the accuracy of the estimations. The lexicons have been automatically generated from an improved version of SentiWordNet, a very popular resource which contains estimations of the positivity and negativity of synsets. Our evaluations on the English and Spanish lexicons show high accuracies in all cases. The resource containing all the lexicons, ML-SentiCon, is publicly available.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados