Ir al contenido

Documat


Resumen de Traducción automática estadística: modelos de traducción basados en máxima entropía y algoritmos de búsqueda

Ismael García Varea Árbol académico

  • Este trabajo de tesis está dedicado en su totalidad a la traducción automática, una disciplina dentro de los campos de la inteligencia artifical y de la lingüística computacional y, más concretamente, dentro de la aproximación estadística a la misma. Todo el desarrollo de la tesis está dentro de la traducción basada en la regla de decisión de Baynes. Por ello se encuadra dentro del enfoque empirista de la traducción automática frente a uno más racionalista basado en técnicas lingüísticas. En dicha aproximación podemos destacar tres ingredientes básicos en un sistema estadístico de traducción: un modelo del lenguaje, un modelo de traducción y un proceso del búsqueda, el cual podemos decir que intenta resolver el problema de la traducción propiamente dicho. El primero no carece de interés, pero ya ha sido ampliamente estudiado con anterioridad, sobre todo por su aplicación a sistemas automáticos de reconocimiento del habla. Por ello en este trabajo nos limitaremos a hacer uso de las técnicas ya desarrolladas en modelado de lenguaje, concretamente en modelos de n-gramas dado su ya demostrado buen funcionamiento. De cualquier forma, dada su importancia en el tema y por completitud en la exposición, se dan una serie de conceptos elementales relacionados con estos modelos. En lo que respecta a los modelos de traducción, en primer lugar, hemos de comentar que este trabajo está basado en lo que se conoce cómo modelos estadísticos de traducciónb asados en relaciones estructurales a nivel de palabra. En esta tesis hemos introducido modelos léxicos dependientes del contexto basándonos en la técnica de máxima entropía. Más concretamente hemos visto cómo desarrollar modelos de traducción basados en esta técnica, cómo integrarlos en los algoritmos de aprendizaje de modelos convencionales de traducción y cómo utilziarlos para mejorar las prestaciones de sistemas automáticos de traducción estadística.


Fundación Dialnet

Mi Documat