Ir al contenido

Documat


Datuen Ustiapena Itzulpen Automatikorako

  • Autores: Andoni Azpeitia Zaldua
  • Directores de la Tesis: Thierry Etchegoyhen (dir. tes.) Árbol académico, María Aranzazu del Pozo Echezarreta (dir. tes.) Árbol académico, Eneko Agirre Bengoa (dir. tes.) Árbol académico
  • Lectura: En la Universidad del País Vasco - Euskal Herriko Unibertsitatea ( España ) en 2022
  • Idioma: euskera
  • Tribunal Calificador de la Tesis: Kepa Sarasola Gabiola (presid.) Árbol académico, Itziar Aduriz (secret.) Árbol académico, Izaskun Fernandez Gonzalez (voc.) Árbol académico
  • Enlaces
    • Tesis en acceso abierto en: ADDI
  • Resumen
    • Datuetan oinarritutako itzulpen automatikoa, azken urteotan gailendutako paradigma da. Sistema hauek datuen bidez elikatzen dira entrenamendu prozesu batean. Abantaila nagusia itzulpen berriak egin ahal izateko jakintza automatikoki erauzten dutela da, baina era berean, jakintza orokortzeko ahalmena entrenamendurako corpuseko adibideengatik mugatuta dago.Tesi honen helburu nagusia corpusen kalitatea hobetzea da hiru alderdi landuz: corpus tamaina handituz, corpusen datuak domeinura egokituz eta datu multzo zaratatsuak iragaziz. Horretarako, lau ikerlerrotan egindako ikerketak aurkezten dira. Lehendabizi, dokumentuen lerrokatzean, bi hizkuntza ezberdinetako dokumentuak lerrotzen dira. Bigarren pausu batean, esaldien lerrokatzean, aurreko pausuko dokumentu pareetako esaldi paraleloak identi katzen dira. Corpusa domeinura egokitzeko, datuen aukeraketaren bidez domeinuz kanpoko corpus handiagoetan domeinuko datu gehiago bilatzen dira. Azkenik, esaldi paraleloen iragazpenarekin entrenamendurako kaltegarriak diren itzulpenak baztertzen dira.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno