Determining the semantic orientation of opinions on products - a comparative analysis

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/8579
Información del item - Informació de l'item - Item information
Título: Determining the semantic orientation of opinions on products - a comparative analysis
Título alternativo: Análisis comparativo de métodos para determinar la polaridad de opiniones sobre productos
Autor/es: Balahur Dobrescu, Alexandra | Montoyo, Andres
Palabras clave: Minería de opiniones | Resumir | Support Vector Machines Sequential Minimal Optimization | Normalized Google Distance | Latent Semantic Analysis | Opinion mining | Summarization
Fecha de publicación: sep-2008
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: BALAHUR DOBRESCU, Alexandra; MONTOYO GUIJARRO, Andrés. “Determining the semantic orientation of opinions on products - a comparative analysis”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 201-208
Resumen: La gran cantidad de opiniones que los usuarios emiten sobre las características de los productos en blogs, foros y en documentos en internet, son de gran ayuda para los posibles compradores o para las compañías que los producen. Sin embargo, determinar de forma automática si un usuario tiene una opinión positiva o negativa de las características de un producto o del propio producto es un problema complejo que requiere de varios pasos para su resolución. Inicialmente hay que identificar las características del producto, extraer los términos que expresan la opinión del usuario y finalmente clasificar el producto de forma positiva o negativa. Este artículo describe un método para resumir los comentarios positivos o negativos sobre el producto a partir de las opiniones que los usuarios expresan a través de las características de los productos. Este problema se resuelve utilizando varias aproximaciones. Inicialmente se utilizan las palabras que aparecen en WordNet Affect (Strapparava and Valitutti, 2004) que expresan sentimiento. Finalmente se utiliza el método de aprendizaje automático (Support Vector Machines Sequential Minimal Optimization (Platt, 1998)) aplicado a las medidas de similitud denominadas Normalized Google Distance (Cilibrasi and Vitanyi, 2006) y Latent Semantic Analysis (Deerwester et al., 1990). Los resultados obtenidos por estas medidas de similitud se comparan, para posteriormente ser analizados y presentar las ventajas y los inconvenientes cuando se aplican al sistema de minería y resúmenes de opiniones. | The high volume of user feedback on products under the form of reviews and forum or blog posts is helpful both to prospective buyers, as well as to producer companies. However, automatically determining the semantic orientation of the opinions expressed on different products and their features is a complex problem, requiring a series of steps: identifying the product features, extracting the opinion words present in a text and finally classifying them as positive or negative. This article concentrates on three approaches to solving the latter problem. One method employed determines polarity of the opinions expressed on the product features using on the one hand the sentiment bearing words in WordNet Affect (Strapparava and Valitutti, 2004). Two other methods explored involved determining the polarity of opinion holders (feature attributes) using Support Vector Machines Sequential Minimal Optimization (Platt, 1998) machine learning with the Normalized Google Distance (Cilibrasi and Vitanyi, 2006) and, respectively, with Latent Semantic Analysis (Deerwester et al., 1990) on a specialized versus a non-specialized corpus of user reviews. We comparatively analyze the methods, show the advantages and disadvantages resulted from using each of them and the results obtained by performing an evaluation on our opinion mining and summarization system.
URI: http://hdl.handle.net/10045/8579
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008)
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_41_24.pdf211,93 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.