Ir al contenido

Documat


Lexical impoverishment in neural machine translation: automatic and human study of Spanish-English noun translation

  • Míriam Espinosa-Giménez ; Mikel L. Forcada [1] Árbol académico
    1. [1] Prompsit Language Engineering, S.L.
  • Localización: Revista tradumàtica: traducció i tecnologies de la informació i la comunicació, ISSN-e 1578-7559, Nº. 22, 2024 (Ejemplar dedicado a: Interacció persona-ordinador en traducció i interpretació: programes i aplicacions), págs. 162-180
  • Idioma: inglés
  • DOI: 10.5565/rev/tradumatica.428
  • Títulos paralelos:
    • Empobrecimiento léxico en la traducción automática neuronal: estudio automático y humano de la traducción de sustantivos entre español e inglés
    • Empobriment lèxic en la traducció automàtica neuronal: estudi automàtic i humà de la traducció de substantius entre el castellà i l'anglès
  • Enlaces
  • Resumen
    • español

      La información necesaria para traducir una palabra en la traducción automática de frases aisladas es a menudo inexistente o inaccesible. En este artículo demostramos que la diversidad en la distribución del conjunto de entrenamiento de los equivalentes en español de sustantivos ingleses se reduce después de haber sido traducidos. Una encuesta a traductores revela que eso a menudo se debe a la falta de contexto del original.

    • català

      La informació necessària per a traduir una paraula en traducció automàtica d'oracions aïllades sovint falta o no se'n pot extraure. Mostrem que la diversitat en la distribució del conjunt d'entrenament dels equivalents espanyols dels substantius anglesos es redueix en la traducció. Una enquesta amb traductors revela que això sovint es deu a la manca de context d'origen.

    • English

      The information required to translate a word in the machine translation of isolated sentences is often missing or unobtainable. We show that the diversity in the training-set distribution of Spanish equivalents of English nouns is reduced in translation. A translator survey reveals this is often due to lack of source context.

  • Referencias bibliográficas
    • Baker, Mona (1993). Corpus linguistics and translation studies: Implications and applications. In Francis, G.; Baker, M.; Tognini-Bonelli,...
    • Cambridge (2022). Cambridge English Dictionary. https://dictionary.cambridge.org/dictionary/english [Accessed: 20241220]
    • Helsinki NLP (2019). Description of an English–Spanish machine translation system. https://github.com/Helsinki-NLP/OPUS-MT-train/tree/master/models/en-es...
    • Helsinki NLP (2020). English–Spanish machine translation model [neural machine translation model]. https://huggingface.co/Helsinki-NLP/opus-mt-en-es...
    • Hugging Face (2024a). The AI community building the future: The platform where the machine learning community collaborates on models, datasets,...
    • Hugging Face (2024b). Transformers 4.47.1 [Python library] https://pypi.org/project/transformers [Accessed: 20241220]
    • Jimenez-Crespo, Miguel A. (2023). “Translationese” (and “post-editese”?) no more: on importing fuzzy conceptual tools from Translation Studies...
    • Liber, A.F. (1963). Problems of Translation. Pediatrics v. 32, n. 2. p. 310. https://doi.org/10.1542/peds.32.2.310 [Accessed: 20241220]
    • Merriam-Webster (2022). Merriam-Webster English Dictionary. https://www.merriam-webster.com [Accessed: 20241220]
    • Ondoño-Soler, Nerea; Forcada, Mikel L. (2022). The Exacerbation of (Grammatical) Gender Stereotypes in English–Spanish Machine Translation....
    • Shannon, Claude (1948). A mathematical theory of communication. The Bell System Technical Journal v. 27, n. 3. pp. 379–423. https://web.archive.org/web/20121108191018/https://www.alcatel-lucent.com/bstj/vol27-1948/articles/bstj27-3-379.pdf...
    • Toral, Antonio. (2019). Post-editese: an Exacerbated Translationese. In Proceedings of Machine Translation Summit XVII: Research Track, Dublin,...
    • Tiedemann, Jörg; Thottingal, Santhosh (2020). OPUS-MT – Building open translation services for the World. In Proceedings of the 22nd Annual...
    • Vanmassenhove, Eva; Shterionov, Dimitar; Way, Andy. (2019). Lost in Translation: Loss and Decay of Linguistic Richness in Machine Translation....
    • Vanmassenhove, Eva; Shterionov, Dimitar; Gwilliam, Matthew (2021). Machine Translationese: Effects of Algorithmic Bias on Linguistic Complexity...
    • Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; Uszkoreit, Jakob; Jones, Llion; Gomez, Aidan N.; Kaiser, Łukasz; Polosukhin, Illia (2017). Attention...
    • Volansky, Vered; Ordan, Noam; Wintner, Shuly. (2015). On the features of translationese. Digital Scholarship in the Humanities, v. 30 n. 1,...
    • Wordreference (2022). English–Spanish dictionary. https://www.wordreference.com [Accessed 20241220]

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno