Ir al contenido

Documat


Resumen de SINAI at Twitter-Normalization 2013

Arturo Montejo Ráez Árbol académico, Manuel Carlos Díaz Galiano Árbol académico, Eugenio Martínez Cámara Árbol académico, María Teresa Martín Valdivia Árbol académico, Miguel Ángel García Cumbreras Árbol académico, Luis Alfonso Ureña López Árbol académico

  • español

    Este artículo presenta el sistema de normalización de tweets desarrollado por el grupo SINAI. Realizamos una serie de conversiones a partir de lexicones de traducción y un corrector ortográfico. Nuestro sistema obtiene un resultado de accuracy bajo, un 37.6%, y analizando los resultados necesita mejorarse en varios aspectos tales como diminutivos y superlativos, tratamiento de entidades o abreviaturas.

  • English

    In this paper, we present the Twitter-normalization system developed by the SINAI group. Our system performs a series of conversions on the text by the use of translation lexicons and a spell checker. We obtain a poor result, only 37.6% of accuracy, and after the analysis of these results our system should be improved in areas such as the treatment of diminutives and superlatives, entities or abbreviations.


Fundación Dialnet

Mi Documat