Ir al contenido

Documat


Resumen de DLSI en Tweet-norm 2013: normalización de Tweets en Español

Alejandro Mosquera López, Paloma Moreda Pozo Árbol académico

  • español

    La gran variedad léxica y su facilidad de acceso a un gran volumen de información convierten a la Web 2.0 en un recurso importante para el Procesamiento del Lenguaje Natural. Sin embargo, la frecuente aparición de fenómenos lingüísticos no normativos pueden dificultar el procesado automático de estos textos. En este trabajo se describe la participación en el taller sobre Normalización de Tweets en el congreso de la SEPLN (Tweet-norm 2013). El taller propone una única tarea con el objetivo de estandarizar textos no normativos en español extraídos de Twitter. Para dicha tarea, se ha hecho uso de TENOR, una herramienta de normalización multilingüe para textos de la Web 2.0.

  • English

    The lexical richness and its ease of access to large volumes of information converts the Web 2.0 into an important resource for Natural Language Processing. Nevertheless, the frequent presence of non-normative linguistic phenomena that can make any automatic processing challenging. In this paper is described the participation in the Text Normalisation Workshop at the SEPLN conference (Tweet-norm 2013). The Workshop includes one unique task focused on the normalisation of Spa- nish tweets. For this task we have used TENOR, a multilingual lexical normalisation tool for Web 2.0 texts.


Fundación Dialnet

Mi Documat