A Bidirectional Recurrent Neural Language Model for Machine Translation

Peris, Álvaro; Casacuberta Nolla, Francisco

A Bidirectional Recurrent Neural Language Model for Machine Translation

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/49282

Información del item - Informació de l'item - Item information
Título:	A Bidirectional Recurrent Neural Language Model for Machine Translation
Título alternativo:	Un modelo de lenguaje neuronal recurrente bidireccional para la traducción automática
Autor/es:	Peris, Álvaro \| Casacuberta Nolla, Francisco
Palabras clave:	Language modelling \| Bidirectional recurrent neural networks \| Instance selection \| Statistical machine translation \| Modelado de lenguaje \| Redes neuronales recurrentes bidireccionales \| Selección de datos \| Traducción automática estadística
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	sep-2015
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	Procesamiento del Lenguaje Natural. 2015, 55: 109-116
Resumen:	A language model based in continuous representations of words is presented, which has been applied to a statistical machine translation task. This model is implemented by means of a bidirectional recurrent neural network, which is able to take into account both the past and the future context of a word in order to perform predictions. Due to its high temporal cost at training time, for obtaining relevant training data an instance selection algorithm is used, which aims to capture useful information for translating a test set. Obtained results show that the neural model trained with the selected data outperforms the results obtained by an n-gram language model. \| Se presenta un modelo de lenguaje basado en representaciones continuas de las palabras, el cual se ha aplicado a una tarea de traducción automática estadística. Este modelo está implementado por una red neuronal recurrente bidireccional, la cual es capaz de tener en cuenta el contexto pasado y futuro de una palabra para realizar predicciones. Debido su alto coste temporal de entrenamiento, para obtener datos de entrenamiento relevantes se emplea un algoritmo de selección de oraciones, el cual busca capturar información útil para traducir un determinado conjunto de test. Los resultados obtenidos muestran que el modelo neuronal entrenado con los datos seleccionados es capaz de mejorar los resultados obtenidos por un modelo de lenguaje de n-gramas.
Patrocinador/es:	The research leading to these results has received funding from the Generalitat Valenciana under grant Prometeo/2009/014.
URI:	http://hdl.handle.net/10045/49282
ISSN:	1135-5948
Idioma:	eng
Tipo:	info:eu-repo/semantics/article
Derechos:	© Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica:	si
Versión del editor:	http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 55 (2015)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_55_12.pdf		753,48 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo