Ir al contenido

Documat


Análisis Léxico sobre los Tweets de Twitter

    1. [1] Departamento de Informática y Automática - Facultad de Traducción y Documentación, Universidad de Salamanca
    2. [2] 1Departamento de Informática y Automática - Facultad de Traducción y Documentación, Universidad de Salamanca
  • Localización: Avances en Informática y Automática. Séptimo Workshop / coord. por Juan Cruz Benito, Alicia García Holgado Árbol académico, S. García, Daniel Hernández Alfageme, María Navarro Cáceres, Roberto Vega Ruiz, 2013, ISBN 84-695-8670-X, págs. 21-36
  • Idioma: español
  • Enlaces
  • Resumen
    • Este documento ofrece un acercamiento sobre el Análisis léxico enfocado en los tweets de Twitter, presentando el desarrollo de unaaplicación web que se podrá conectar con Twitter involucrando el manejode un clasificador de texto sobre la web, y de esta manera poder descubrir las características esenciales de los tweets seleccionados ya sea deforma individual o masiva, todo esto ejecutándose en tiempo real o bienagregando el contenido a la base de datos que ofrece la aplicación paraposteriormente tratar los tweets al gusto del usuario. Durante el procesode investigación se han utilizado técnicas de stemming y tokenizaciónque ayudan a procesar el tweet de forma más limpia y sin ruido; igualmente, para la clasificación se han creado varios diccionarios en formatoXML basados en las áreas de ciencia y tecnología, también diccionariosque ayuden a identificar palabras vacías; para realizar la clasificación sepropuso el algoritmo Naïve Bayes.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno