Las redes sociales se han convertido en un medio de comunicación social donde los usuarios establecen conversaciones y comparten sus opiniones. El aumento de las conexiones digitales ha provocado la difusión del lenguaje ofensivo. El Procesamiento del Lenguaje Natural tiene por objetivo el desarrollo de sistemas computacionales para integrar el lenguaje humano y ofrece un sinfín de ventajas, como la posibilidad de moderar las conductas nocivas en estas plataformas.
Esta tesis investiga métodos avanzados basados en aprendizaje de transferencia para abordar la detección del lenguaje ofensivo. Para ello, se han generado recursos lingüísticos que son esenciales para entrenar sistemas de aprendizaje automático, en particular para el español. Además, se han identificado diferentes fenómenos lingüísticos relacionados con la expresión del lenguaje ofensivo y se ha implementado una metodología novedosa que se basa e la integración de estos fenómenos en un sistema de aprendizaje multitarea para detectar con mayor precisión este problema.
Social media have grown into the prirnary means of communicating between people, allowing users to have conversations and share their opinions. The rise in digital social connections has led to the dissemination of harmful communicatton. The Natural Language Processing arises for the development of computational systems to interpret human language. Giving computers this skill offers a plethora of benefits, including the potential to moderate harmful conduct on social media. This thesis relies on advanced methods based on transfer learning to tackle the offensive language detection problem. We have generated appropriate resources to enable us to train Machine Learning systems, particularly for Spanish , for which we discovered a significant lack of resources. Moreover, we have identified different linguistic phenomena that could occur in the expression of offensive language and proposed a novel methodology that relies on integrating these phenomena into a Multi-Task Learning system to detect more accurate this problem.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados