Unsupervised Neural Machine Translation, a new paradigm solely based on monolingual text

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/96620
Información del item - Informació de l'item - Item information
Título: Unsupervised Neural Machine Translation, a new paradigm solely based on monolingual text
Título alternativo: Traducción Automática Neuronal no Supervisada, un nuevo paradigma basado solo en textos monolingües
Autor/es: Artetxe, Mikel | Labaka Intxauspe, Gorka | Agirre Bengoa, Eneko
Palabras clave: Machine Translation | Deep Learning | Word Embedding | Traducción Automática | Aprendizaje Profundo | Word Embeddings
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2019, 63: 151-154. doi:10.26342/2019-63-18
Resumen: This article presents UnsupNMT, a 3-year project of which the first year has already been completed. UnsupNMT proposes a radically different approach to machine translation: unsupervised translation, that is, translation based on monolingual data alone with no need for bilingual resources. This method is based on deep learning of temporal sequences and uses cutting-edge interlingual word representations in the form of cross-lingual word embeddings. This project is not only a highly innovative proposal but it also opens a new paradigm in machine translation which branches out to other disciplines, such us transfer learning. Despite the current limitations of unsupervised machine translation, the techniques developed are expected to have great repercussions in areas where machine translation achieves worse results, such as translation between languages which have little contact, e.g. German and Russian. | Este artículo presenta UnsupNMT, un proyecto de 3 años del que ha trascurrido la primera anualidad. UnsupNMT plantea un método radicalmente diferente de hacer traducción automática: la traducción no supervisada, es decir, basada exclusivamente en textos monolingües sin ningún recurso bilingüe. El método propuesto se basa en aprendizaje profundo de secuencias temporales combinado con los últimos avances en representación interlingual de palabras (“cross-lingual word embeddings”). Además de ser una propuesta propiamente innovadora, abre un nuevo paradigma de traducción automática con ramificaciones en otras disciplinas como el aprendizaje por transferencia (“transfer learning”). A pesar de las limitaciones actuales de la traducción automática no-supervisada, se espera que las técnicas desarrolladas tengan gran repercusión en áreas donde la traducción automática consigue peores resultados, como la traducción entre pares de idiomas con poco contacto, tales como alemán o ruso.
Patrocinador/es: UnsupNMT is a project funded by the Spanish Ministry of Economy, Industry and Competitiveness (TIN2017-91692-EXP).
URI: http://hdl.handle.net/10045/96620
ISSN: 1135-5948
DOI: 10.26342/2019-63-18
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2019-63-18
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_63_18.pdf823,06 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.