, Alba Bonet Jover
Pese a los avances en Procesamiento del Lenguaje Natural (PLN), el lenguaje figurado sigue siendo un reto para los grandes modelos de lenguaje (LLM). En este estudio evaluamos y comparamos el rendimiento de los LLM ChatGPT-4o, DeepSeek-V3, Gemini 2.5 Pro Experimental y Grok 3 Preview en tareas de procesamiento del lenguaje figurado. Basándonos en la teoría del lenguaje figurativo convencional (CFLT) de Dobrovol’skij y Piirainen (2021), compilamos CLUE, un conjunto de datos inglés-español de metáforas, modismos, símiles y proverbios. A partir de él, diseñamos y llevamos a cabo pruebas de detección, interpretación y generación de lenguaje figurado. Los modelos ofrecieron resultados excelentes en detección (0,94) e interpretación (0,91) en ambas lenguas. Sin embargo, exceptuando a Gemini, su rendimiento bajó notablemente en la prueba de generación (0,70), especialmente en español. Concluimos que los LLM son eficaces en tareas de comprensión del lenguaje figurado, pero su capacidad para producirlo es más limitada.
Despite advances in Natural Language Processing (NLP), figurative language remains a challenge for Large Language Models (LLMs). We evaluate and compare the performance of LLMs ChatGPT-4o, DeepSeek-V3, Gemini 2.5 Pro Experimental, and Grok 3 Preview in figurative language processing tasks. Drawing on the Conventional Figurative Language Theory (CFLT) proposed by Dobrovol’skij and Piirainen (2021), we compiled CLUE, an English-Spanish dataset of metaphors, idioms, similes, and proverbs.
Using this dataset, we designed and conducted tests on figurative language detection, interpretation, and generation. The models exhibited strong performance in detection (0.94) and interpretation (0.91) tasks in both languages. However, with the exception of Gemini, their performance dropped significantly in the generation task (0.70), particularly in Spanish. We conclude that LLMs are effective in figurative language comprehension tasks but remain limited in their ability to produce it.
© 2008-2026 Fundación Dialnet · Todos los derechos reservados