Ir al contenido

Documat


Resumen de Análisis Léxico sobre los Tweets de Twitter

Astrid Paola Bográn, José Luis Alonso Berrocal Árbol académico, Luis Carlos García de Figuerola Paniagua Árbol académico

  • Este documento ofrece un acercamiento sobre el Análisis léxico enfocado en los tweets de Twitter, presentando el desarrollo de unaaplicación web que se podrá conectar con Twitter involucrando el manejode un clasificador de texto sobre la web, y de esta manera poder descubrir las características esenciales de los tweets seleccionados ya sea deforma individual o masiva, todo esto ejecutándose en tiempo real o bienagregando el contenido a la base de datos que ofrece la aplicación paraposteriormente tratar los tweets al gusto del usuario. Durante el procesode investigación se han utilizado técnicas de stemming y tokenizaciónque ayudan a procesar el tweet de forma más limpia y sin ruido; igualmente, para la clasificación se han creado varios diccionarios en formatoXML basados en las áreas de ciencia y tecnología, también diccionariosque ayuden a identificar palabras vacías; para realizar la clasificación sepropuso el algoritmo Naïve Bayes.


Fundación Dialnet

Mi Documat