David Picó Vila
La traducción automática es un campo muy activo de las tecnologías del lenguaje natural que ha experimentado un fuerte desarrollo en las últimas décadas, Las técnicas que se han puesto en marcha podrían clasificarse, de manera un tanto simplista, en técnicas "basadas en el conocimiento", que utilizan información aportada por expertos lingüistas, y técnicas "basadas en ejemplos", que extraen la información automáticamente a partir de corpus de texto.
El trabajo de esta tesis se enmarca en la seguna familia de técnicas, las basadas en ejemplos. Nos hemos centrado en el uso de un modelo en particular:
el de los transductores estocásticos de estados finitos. Este modelo (y otros parecidos) se utiliza en muchas áreas de las tecnologías del lenguaje y con finalidades diferentes. Nosotros lo utilizamos aquí para la traducción entre lenguas distintas.
La tesis aborda el problema de la creación de transductores estocásticos de estados finitos a partir de muestras de traducción. Estas muestras consisten en pares de frases en idiomas diferentes en los que una frase es traducción de la otra. Por un lado, aportamos varios algoritmos para la estimación de la parte probabilística de los transductores, sobre el supuesto de que se conoce ya la estructura. Por otro lado, y como contribución fundamental del trabajo, se expone un método y un conjunto de algoritmos para inferir transductores (con estructura y probabilidades) a partir de muestras, que agrupamos bajo las siglas genéricas de GIATI (por el inglés, Grammatical inference algorithms.
Esta memoria presenta una primera exposición teórica de estos algoritmos, y continúa con un estudio práctico de implementación en el que se exploran diferentes formas de poner en uso GIATI. Se presentan también estudios experimentales de traducción que ponen de manifiesto las posibilidades reales de aplicación de estas técnicas.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados