Este artículo muestra un método para la marcación automática de emociones (EmoTag) en textos en lengua inglesa, prestando especial atención a la utilización de un analizador de dependencias (MINIPAR) para la localización de las palabras implicadas en las negaciones. De entre los múltiples métodos existentes para representar las emociones EmoTag emplea las dimensiones emocionales (activación, evaluación y control). El primer paso para desarrollar EmoTag fue la anotación de un corpus de cuentos por parte de varios evaluadores. Los resultados del procesamiento de este corpus conforman lo que hemos denominado List of Emotional Words (LEW) que no es más que una base de datos de palabras con las emociones asociadas a ellas en terminos de dimensiones emocionales. A continuación, creamos un algoritmo para el marcado automático de textos con emociones empleando distintas bases de conocimiento: LEW, ANEW y WordNet. Por último, el algoritmo de marcado ha sido evaluado sobre alguno de los textos que se emplearon en la creación de la lista LEW y sobre textos nuevos. Los resultados serán comentados al final del artículo basandonos fundamentalmente en dos aspectos: corrección y cobertura del algoritmo propuesto y técnicas y soluciones que emplearemos para mejorar los resultados.
This paper presents an approach to automated marking up of English texts with emotional labels (EmoTag), stressing the employing of dependency-based parser (MINIPAR) for the finding of words related to negatives. The approach considers the representation of emotions as emotional dimensions (activation, evaluation and dominance). The first step in order to develop EmoTag was to get a corpus of example texts previously annotated by human evaluators. The results of the word processing was a List of Emotional Words (LEW). Next an algorithm for the automated mark up of text is proposed. This algorithm employs a combination of the LEW resource, the ANEW word list and WordNet for knowledge-based expansion of words not occurring in either. Finally, the algorithm for automated mark up is tested against texts from the original samples used for feature extraction to test its correctness. It is also tested against new text samples to test its coverage. The results are discussed with respect to two main issues: correctness and coverage of the proposed algorithm, and additional techniques and solutions that may be employed to improve the results.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados