Unsupervised Neural Machine Translation, a new paradigm solely based on monolingual text
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/96620
Título: | Unsupervised Neural Machine Translation, a new paradigm solely based on monolingual text |
---|---|
Título alternativo: | Traducción Automática Neuronal no Supervisada, un nuevo paradigma basado solo en textos monolingües |
Autor/es: | Artetxe, Mikel | Labaka Intxauspe, Gorka | Agirre Bengoa, Eneko |
Palabras clave: | Machine Translation | Deep Learning | Word Embedding | Traducción Automática | Aprendizaje Profundo | Word Embeddings |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2019 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2019, 63: 151-154. doi:10.26342/2019-63-18 |
Resumen: | This article presents UnsupNMT, a 3-year project of which the first year has already been completed. UnsupNMT proposes a radically different approach to machine translation: unsupervised translation, that is, translation based on monolingual data alone with no need for bilingual resources. This method is based on deep learning of temporal sequences and uses cutting-edge interlingual word representations in the form of cross-lingual word embeddings. This project is not only a highly innovative proposal but it also opens a new paradigm in machine translation which branches out to other disciplines, such us transfer learning. Despite the current limitations of unsupervised machine translation, the techniques developed are expected to have great repercussions in areas where machine translation achieves worse results, such as translation between languages which have little contact, e.g. German and Russian. | Este artículo presenta UnsupNMT, un proyecto de 3 años del que ha trascurrido la primera anualidad. UnsupNMT plantea un método radicalmente diferente de hacer traducción automática: la traducción no supervisada, es decir, basada exclusivamente en textos monolingües sin ningún recurso bilingüe. El método propuesto se basa en aprendizaje profundo de secuencias temporales combinado con los últimos avances en representación interlingual de palabras (“cross-lingual word embeddings”). Además de ser una propuesta propiamente innovadora, abre un nuevo paradigma de traducción automática con ramificaciones en otras disciplinas como el aprendizaje por transferencia (“transfer learning”). A pesar de las limitaciones actuales de la traducción automática no-supervisada, se espera que las técnicas desarrolladas tengan gran repercusión en áreas donde la traducción automática consigue peores resultados, como la traducción entre pares de idiomas con poco contacto, tales como alemán o ruso. |
Patrocinador/es: | UnsupNMT is a project funded by the Spanish Ministry of Economy, Industry and Competitiveness (TIN2017-91692-EXP). |
URI: | http://hdl.handle.net/10045/96620 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2019-63-18 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2019-63-18 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 63 (2019) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_63_18.pdf | 823,06 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.