Arturo Montejo Ráez , Manuel Carlos Díaz Galiano , Eugenio Martínez Cámara , María Teresa Martín Valdivia , Miguel Ángel García Cumbreras , Luis Alfonso Ureña López
Este artículo presenta el sistema de normalización de tweets desarrollado por el grupo SINAI. Realizamos una serie de conversiones a partir de lexicones de traducción y un corrector ortográfico. Nuestro sistema obtiene un resultado de accuracy bajo, un 37.6%, y analizando los resultados necesita mejorarse en varios aspectos tales como diminutivos y superlativos, tratamiento de entidades o abreviaturas.
In this paper, we present the Twitter-normalization system developed by the SINAI group. Our system performs a series of conversions on the text by the use of translation lexicons and a spell checker. We obtain a poor result, only 37.6% of accuracy, and after the analysis of these results our system should be improved in areas such as the treatment of diminutives and superlatives, entities or abbreviations.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados