Aitana Morote Martínez, Juan Pablo Consuegra Ayala, Elena Lloret Pastor 
Los word embeddings son ampliamente utilizados en el Procesamiento del Lenguaje Natural, pero a menudo codifican sesgos de género, lo que puede dar lugar a resultados discriminatorios. Existen varias técnicas de mitigación de sesgos (debiasing), centradas en el inglés, que no tienen en cuenta las complejidades de las lenguas con género gramatical como el español. Este artículo presenta INLP-Gram, un algoritmo dise˜nado para mitigar el sesgo de género en embeddings en español que es capaz de conservar la información de género gramatical. Nuestro algoritmo es una adaptación del algoritmo INLP (Iterative Nullspace Projection), pero teniendo en cuenta las variaciones morfológicas de idiomas con género gramatical. Evaluamos INLP-Gram mediante el Word Embedding Association Test (WEAT) y una prueba de clasificación del género gramatical. Nuestros resultados demuestran que INLPGram reduce efectivamente el sesgo de género a la vez que mantiene las distinciones gramaticales de género. Este trabajo supone un avance en las técnica de mitigación de sesgos para word embeddings en lenguas con riqueza morfológica.
Word embeddings are widely used in Natural Language Processing but often encode gender biases, which can lead to discriminatory outcomes. Various debiasing techniques exist, especially focusing on English, thus failing to account for the complexities of languages with grammatical gender, such as Spanish. In this paper, we propose INLP-Gram, an algorithm designed to mitigate gender bias in Spanish word embeddings while preserving grammatical gender information. It is an adaptation of the Iterative Nullspace Projection (INLP). We evaluate INLP-Gram using the Word Embedding Association Test (WEAT) and a grammatical gender classification test. Our results demonstrate that INLP-Gram effectively reduces gender bias while maintaining grammatical gender distinctions. This work advances bias mitigation techniques for word embeddings in morphologically-rich languages.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados