MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/109299
Información del item - Informació de l'item - Item information
Título: MINTZAI: Sistemas de Aprendizaje Profundo E2E para Traducción Automática del Habla
Título alternativo: MINTZAI: End-to-end Deep Learning for Speech Translation
Autor/es: Etchegoyhen, Thierry | Arzelus, Haritz | Gete, Harritxu | Alvarez, Aitor | Hernáez Rioja, Inmaculada | Navas Cordón, Eva | González-Docasal, Ander | Osácar, Jaime | Benites, Edson | Ellakuria, Igor | Calonge, Eusebi | Martin, Maite
Palabras clave: Traducción del Habla | Traducción Automática | Reconocimiento del Habla | Síntesis del Habla | Aprendizaje profundo | Speech Translation | Machine Translation | Speech Recognition | Text to Speech | Deep learning
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2020
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2020, 65: 97-100. https://doi.org/10.26342/2020-65-12
Resumen: La traducción automática del habla consiste en traducir el habla de un idioma origen en texto o habla de un idioma destino. Sistemas de este tipo tienen múltiples aplicaciones y son de especial interés en comunidades multilingües como la Unión Europea. El enfoque estándar en el ámbito se basa en componentes principales distintos que encadenan el reconocimiento del habla, la traducción automática, y la síntesis del habla. Con los avances obtenidos mediante redes neuronales artificiales y aprendizaje profundo, la posibilidad de desarrollar sistemas de traducción del habla extremo a extremo (end-to-end), sin descomposición en etapas intermedias, está dando lugar a una fuerte actividad en investigación y desarrollo. En este artículo, se hace un repaso del estado del arte en este área y se presenta el proyecto mintzai, que se está realizando en el ámbito. | Speech Translation consists in translating speech in one language into text or speech in a different language. These systems have numerous applications, particularly in multilingual communities such as the European Union. The standard approach in the field involves the chaining of separate components for speech recognition, machine translation and speech synthesis. With the advances made possible by artificial neural networks and Deep Learning, training end-to-end speech translation systems has given rise to intense research and development activities in recent times. In this paper, we review the state of the art and describe project mintzai, which is being carried out in this field.
URI: http://hdl.handle.net/10045/109299
ISSN: 1135-5948
DOI: 10.26342/2020-65-12
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.14198/10.26342/2020-65-12
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 65 (2020)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_65_12.pdf857,35 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.