Ir al contenido

Documat


Resumen de Overview of MeOffendEs at IberLEF 2021: offensive Language Detection in Spanish Variants

Horacio Jarquín Vásquez, Luis Villaseñor Pineda Árbol académico, Flor Miriam Plaza del Arco Árbol académico, Marco Casavantes, Hugo Jair Escalante Árbol académico, María Teresa Martín Valdivia Árbol académico, Arturo Montejo Ráez Árbol académico, Manuel Montes Gomez Árbol académico

  • español

    Este artículo presenta la tarea MeOffendES 2021, organizada en iberLEF 2021 junto a la 37ª Conferencia Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2021). El objetivo principal de MeOffendEs es promover la detección del lenguaje ofensivo en las variantes del español. La tarea compartida implica cuatro subtareas, las dos primeras corresponden a la identificación de categorías de lenguaje ofensivo en textos genéricos en español extraídos de diferentes redes sociales, mientras que las subtareas 3 y 4 están relacionadas con la identificación de lenguaje ofensivo dirigido a la variante mexicana del español. Para la competencia se han puesto a disposición de la comunidad del Procesamiento del Lenguaje Natural dos conjuntos de datos anotados con lenguaje ofensivo. MeOffendes ha atraído a un gran número de participantes: un total de 69 se inscribieron para participar en la tarea, 12 presentaron resultados oficiales sobre los datos de evaluación y 10 presentaron artículos describiendo su sistema. Los conjuntos de datos y los resultados oficiales están disponibles en el sitio web de la tarea compartida: https://competitions.codalab.org/competitions/28679.

  • English

    This paper is an overview of MeOffendES 2021, organized at IberLEF 2021 and co-located with the 37th International Conference of the Spanish Society for Natural Language Processing (SEPLN 2021). The main purpose of MeOffendEs is to promote research on the detection of offensive language in Spanish variants. The shared task involve four subtasks, the first two correspond to the identification of offensive language categories in generic Spanish texts from different social media platforms, while subtasks 3 and 4 are related to the identification of offensive language targeting the Mexican variant of Spanish. Two annotated datasets on offensive language have been released to the Natural Language Processing community. MeOffendes attracted a large number of participants: a total of 69 signed up to participate in the task, 12 submitted official runs on the test data, and 10 submitted system description papers. Corpora and results are available at the shared task website at https://competitions.codalab.org/competitions/28679.


Fundación Dialnet

Mi Documat