A Bidirectional Recurrent Neural Language Model for Machine Translation
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/49282
Título: | A Bidirectional Recurrent Neural Language Model for Machine Translation |
---|---|
Título alternativo: | Un modelo de lenguaje neuronal recurrente bidireccional para la traducción automática |
Autor/es: | Peris, Álvaro | Casacuberta Nolla, Francisco |
Palabras clave: | Language modelling | Bidirectional recurrent neural networks | Instance selection | Statistical machine translation | Modelado de lenguaje | Redes neuronales recurrentes bidireccionales | Selección de datos | Traducción automática estadística |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2015 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2015, 55: 109-116 |
Resumen: | A language model based in continuous representations of words is presented, which has been applied to a statistical machine translation task. This model is implemented by means of a bidirectional recurrent neural network, which is able to take into account both the past and the future context of a word in order to perform predictions. Due to its high temporal cost at training time, for obtaining relevant training data an instance selection algorithm is used, which aims to capture useful information for translating a test set. Obtained results show that the neural model trained with the selected data outperforms the results obtained by an n-gram language model. | Se presenta un modelo de lenguaje basado en representaciones continuas de las palabras, el cual se ha aplicado a una tarea de traducción automática estadística. Este modelo está implementado por una red neuronal recurrente bidireccional, la cual es capaz de tener en cuenta el contexto pasado y futuro de una palabra para realizar predicciones. Debido su alto coste temporal de entrenamiento, para obtener datos de entrenamiento relevantes se emplea un algoritmo de selección de oraciones, el cual busca capturar información útil para traducir un determinado conjunto de test. Los resultados obtenidos muestran que el modelo neuronal entrenado con los datos seleccionados es capaz de mejorar los resultados obtenidos por un modelo de lenguaje de n-gramas. |
Patrocinador/es: | The research leading to these results has received funding from the Generalitat Valenciana under grant Prometeo/2009/014. |
URI: | http://hdl.handle.net/10045/49282 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 55 (2015) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_55_12.pdf | 753,48 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.