En este trabajo abordamos la ampliación de lexicones de opinión específicos de dominio a partir de textos del dominio elegido. El método se basa en la construcción de clasificadores que catalogan las palabras de entrada como positivas, negativas o neutras, y en un criterio estricto de selección de las palabras que pretende garantizar la precisión de las nuevas incorporaciones al lexicón. Se utilizan representaciones continuas de palabras (word embeddings) como espacio de características de los clasificadores. Los resultados confirman que dichas representaciones contienen información relativa a la polaridad de las palabras, obteniéndose una precisión en la selección de los candidatos y en la estimación de su polaridad de alrededor del 94% para los tres dominios analizados, con una cobertura en torno al 50% de las palabras de opinión contenidas en los textos de partida.
In this work we present a domain-specific opinion lexicon expansion method. The method is based on classifiers which categorize words as positive, negative or neutral, and a strict selection criteria of words intended to ensure the precision of the new additions to the lexicon. We use word embeddings as the feature space of the classifiers. The results confirm that these representations contain information on the polarity of the words, obtaining a precision in the selection of candidates and the estimation of its polarities of about 94% for the three domains analyzed, covering around 50% of the opinion words contained in the initial texts.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados