Ir al contenido

Documat


Document-Level Machine Translation as a Re-translation Process

  • Autores: Eva María Martínez García, Cristina España Bonet Árbol académico, Lluís Márquez i Villodre Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 53, 2014, págs. 103-110
  • Idioma: inglés
  • Títulos paralelos:
    • Traducción Automática a Nivel de Documento como Proceso de Retraducción
  • Enlaces
  • Resumen
    • español

      Los sistemas de Traducción Automática suelen estar diseñados para traducir un texto oración por oración ignorando la información del discurso y provocando así la aparición de incoherencias en las traducciones. En este artículo se presentan varios sistemas que detectan incoherencias a nivel de documento y proponen nuevas traducciones parciales para mejorar el nivel de cohesión y coherencia global. El estudio se centra en dos casos: palabras con traducciones inconsistentes en un texto y la concordancia de género y número entre palabras. Dado que se trata de fenómenos concretos, los cambios no se ven reflejados en una evaluación automática global pero una evaluación manual muestra mejoras en las traducciones.

    • English

      Most of the current Machine Translation systems are designed to translate a document sentence by sentence ignoring discourse information and producing incoherencies in the final translations. In this paper we present some document-level-oriented post-processes to improve translations' coherence and consistency. Incoherences are detected and new partial translations are proposed. The work focuses on studying two phenomena: words with inconsistent translations throughout a text and also, gender and number agreement among words. Since we deal with specific phenomena, an automatic evaluation does not reflect significant variations in the translations. However, improvements are observed through a manual evaluation.

  • Referencias bibliográficas
    • Gong, Z., M. Zhang, and G. Zhou. 2011. Cache-based document-level statistical machine translation. In Proc. of the 2011 Conference on Empirical...
    • González, M., J. Giménez, and L. Màrquez. 2012. A graphical interface for MT evaluation and error analysis. In Proc. of the 50th ACL Conference,...
    • Hardmeier, C. and M. Federico. 2010. Modelling pronominal anaphora in statistical machine translation. In Proc. of the 7th International Workshop...
    • Hardmeier, C., J. Nivre, and J. Tiedemann. 2012. Document-wide decoding for phrase-based statistical machine translation. In Proc. of the...
    • Hardmeier, C., S. Stymne, J. Tiedemann, and J. Nivre. 2013. Docent: A documentlevel decoder for phrase-based statistical machine translation....
    • Koehn, P. 2005. Europarl: A Parallel Corpus for Statistical Machine Translation. In Conference Proc.: the tenth Machine Translation Summit,...
    • Koehn, P., H. Hoang, A. Birch, C. Callison-Burch, M. Federico, N. Bertoldi, B. Cowan, W. Shen, C. Moran, R. Zens, C. Dyer, O. Bojar, A. Constantin,...
    • Nagard, R. Le and P. Koehn. 2010. Aiding pronouns translation with co-reference resolution. In Proc. of Joint 5th Workshop on Statistical...
    • Och, F. 2003. Minimum error rate training in statistical machine translation. In Proc. of the ACL Conference.
    • Och, F. and H. Ney. 2003. A systematic comparison of various statistical alignment models. Computational Linguistics.
    • Padró, L., S. Reese, E. Agirre, and A. Soroa. 2010. Semantic services in freeling 2.1: Wordnet and ukb. In Principles, Construction, and Application...
    • Papineni, K., S. Roukos, T. Ward, and W.J. Zhu. 2002. Bleu: a method for automatic evaluation of machine translation. In Proc. of the 40th...
    • Sapena, E., L. Padró, and J. Turmo. 2010. A global relaxation labeling approach to coreference resolution. In Proceedings of 23rd COLING,...
    • Stolcke, A. 2002. SRILM - An extensible language modeling toolkit. In Proc. Intl. Conf. on Spoken Language Processing.
    • Surdeanu, M., J. Turmo, and E. Comelles. 2005. Named entity recognition from spontaneous open-domain speech. In Proc. of the 9th Interspeech.
    • Xiao, T., J. Zhu, S. Yao, and H. Zhang. 2011. Document-level consistency verification in machine translation. In Proc. of Machine Translation...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno