Ir al contenido

Documat


Overview of MeOffendEs at IberLEF 2021: offensive Language Detection in Spanish Variants

  • Autores: Horacio Jarquín Vásquez, Luis Villaseñor Pineda Árbol académico, Flor Miriam Plaza del Arco Árbol académico, Marco Casavantes, Marco Casavantes, Hugo Jair Escalante Árbol académico, María Teresa Martín Valdivia Árbol académico, Arturo Montejo Ráez Árbol académico, Manuel Montes Gomez Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 67, 2021, págs. 183-194
  • Idioma: inglés
  • Títulos paralelos:
    • Resumen de la tarea MeOffendEs en IberLEF 2021: detección de lenguaje ofensivo en las variantes del español
  • Enlaces
  • Resumen
    • español

      Este artículo presenta la tarea MeOffendES 2021, organizada en iberLEF 2021 junto a la 37ª Conferencia Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2021). El objetivo principal de MeOffendEs es promover la detección del lenguaje ofensivo en las variantes del español. La tarea compartida implica cuatro subtareas, las dos primeras corresponden a la identificación de categorías de lenguaje ofensivo en textos genéricos en español extraídos de diferentes redes sociales, mientras que las subtareas 3 y 4 están relacionadas con la identificación de lenguaje ofensivo dirigido a la variante mexicana del español. Para la competencia se han puesto a disposición de la comunidad del Procesamiento del Lenguaje Natural dos conjuntos de datos anotados con lenguaje ofensivo. MeOffendes ha atraído a un gran número de participantes: un total de 69 se inscribieron para participar en la tarea, 12 presentaron resultados oficiales sobre los datos de evaluación y 10 presentaron artículos describiendo su sistema. Los conjuntos de datos y los resultados oficiales están disponibles en el sitio web de la tarea compartida: https://competitions.codalab.org/competitions/28679.

    • English

      This paper is an overview of MeOffendES 2021, organized at IberLEF 2021 and co-located with the 37th International Conference of the Spanish Society for Natural Language Processing (SEPLN 2021). The main purpose of MeOffendEs is to promote research on the detection of offensive language in Spanish variants. The shared task involve four subtasks, the first two correspond to the identification of offensive language categories in generic Spanish texts from different social media platforms, while subtasks 3 and 4 are related to the identification of offensive language targeting the Mexican variant of Spanish. Two annotated datasets on offensive language have been released to the Natural Language Processing community. MeOffendes attracted a large number of participants: a total of 69 signed up to participate in the task, 12 submitted official runs on the test data, and 10 submitted system description papers. Corpora and results are available at the shared task website at https://competitions.codalab.org/competitions/28679.

  • Referencias bibliográficas
    • Alvarez-Carmona, M. ´ A., E. Guzmán-Falcón, M. Montes-y-Gómez, H. J. Escalante, L. Villaseñor-Pineda, V. Reyes-Meza, and A. Rico-Sulayes....
    • Aragón, M. E., M. A. ´ Alvarez-Carmona, M. Montes-y-Gómez, H. J. Escalante, L. Villaseñor-Pineda, and D. Moctezuma. 2019. Overview of MEX-A3T...
    • Aragón, M. E., H. J. Jarquín-Vásquez, M. Montes-y-Gómez, H. J. Escalante, L. Villaseñor-Pineda, H. Gómez-Adorno, J. P. Posadas-Durán, and...
    • Aragón, M., H. Jarquín, M. M.-y. Gómez, H. Escalante, L. Villaseñor-Pineda, H. Gómez-Adorno, G. Bel-Enguix, and J. Posadas-Durán. 2020b. Overview of...
    • Aroyehun, S. T. and A. Gelbukh. 2021. Evaluation of intermediate pre-training for the detection of offensive language. In Proceedings of the...
    • Calderón, J. J., E. S. Tellez, and M. Graff. 2021. Dccd-infotec at meoffendes@iberlef21 subtask 3: A transfer learning approach based...
    • Canales, L. and P. Martínez-Barco. 2014. Emotion detection from text: A survey. In Proceedings of the workshop on natural language processing...
    • Cañete, J., G. Chaperon, R. Fuentes, J.-H. Ho, H. Kang, and J. Pérez. 2020. Spanish pre-trained bert model and evaluation data. In PML4DC...
    • Chen, T. and C. Guestrin. 2016. XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on...
    • Díaz-Torres, M. J., P. A. Morán-Méndez, L. Villasenor-Pineda, M. Montes-y Gómez, J. Aguilera, and L. MenesesLerín. 2020. Automatic detection...
    • Garcá-Díaz, J. A., S. M. Jiménez-Zafra, and R. Valencia-García. 2021. Umuteam at meoffendes 2021: Ensemble learning for offensive language...
    • García, M. N. and I. S. Bedmar. 2021. Detecting offensiveness in social network comments. In Proceedings of the Iberian Languages Evaluation...
    • Gómez-Espinosa, V., V. Muñiz-Sanchez, and A. P. López-Monroy. 2021. Transformers pipeline for offensiveness detection in mexican spanish social...
    • Grave, E., P. Bojanowski, P. Gupta, A. Joulin, and T. Mikolov. 2018. Learning word vectors for 157 languages. In Proceedings of the International...
    • Huerta-Velasco, D. A. and H. Calvo. 2021. Using lexical resources for detecting offensiveness in mexican spanish tweets. In Proceedings of...
    • MacAvaney, S., H.-R. Yao, E. Yang, K. Russell, N. Goharian, and O. Frieder. 2019. Hate speech detection: Challenges and solutions. PloS one,...
    • Montes, M., P. Rosso, J. Gonzalo, E. Aragón, R. Agerri, M. Alvarez Carmona, E. Alvarez Mellado, J. Carrillo-de Albornoz, L. Chiruzzo, L....
    • Mubarak, H., K. Darwish, W. Magdy, T. Elsayed, and H. Al-Khalifa. 2020. Overview of osact4 arabic offensive language detection shared task....
    • Plaza-del Arco, F. M., M. D. MolinaGonzález, L. A. Ureña-López, and M. T. Martín-Valdivia. 2021. Comparing pretrained language models for...
    • Qu, S., Q. Que, and Shuangjun. 2021. Noncontextual binary classification for mexican spanish with xlm and cnn. In Proceedings of the Iberian...
    • Qu, Y., Y. Yang, and G. Wang. 2021. Ynu qyc at meoffendes@iberlef 2021: the xlm-roberra and lstm for identifying offensive tweets. In...
    • Razavi, A. H., D. Inkpen, S. Uritsky, and S. Matwin. 2010. Offensive language detection using multi-level classification. In A. Farzindar...
    • Sánchez-Vega, F. and A. P. López-Monroy. 2021. Cimat-gto at meoffendes 2021: Bert’s auxiliary sentence focused on word’s information for offensiveness...
    • Sreelakshmi, K., B. Premjith, and K. P. Soman. 2021. Transformer based offensive language identification in spanish. In Proceedings of the...
    • Tang, E. K., P. N. Suganthan, and X. Yao. 2006. An analysis of diversity measures. Mach. Learn., 65(1):247–271.
    • Twitter. 2021. Tweets – twitter developers. https://developer.twitter.com/. Accessed: 2021-06-30.
    • Wiebe, J., T. Wilson, R. Bruce, M. Bell, and M. Martin. 2004. Learning subjective language. Computational linguistics, 30(3):277–308.
    • Zampieri, M., P. Nakov, S. Rosenthal, P. Atanasova, G. Karadzhov, H. Mubarak, L. Derczynski, Z. Pitenis, and C¸ . C¸ öltekin. 2020. Semeval-2020...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno