En aquest article es presenten algunes de les reeixides principals del projecte PRINCIPLE, finançat per la Unió Europea, en relació amb la recopilació de recursos lingüístics (RL) de qualitat en l’àmbit jurídic per a quatre llengües europees amb pocs recursos: el croat, l’irlandès, el noruec i l’islandès. Després d’il·lustrar la importància d’aquest treball per desenvolupar tecnologies de la traducció en el marc de la Unió Europea i l’Espai Econòmic Europeu, en l’article es descriuen els passos principals per recollir dades, conservar i compartir els RL recopilats amb l’ajuda de proveïdors de dades públics i privats. A continuació, es descriuen el procés de desenvolupament i les característiques clau dels motors de traducció automàtica (TA) neuronal d’última generació adaptats al context jurídic que s’han creat amb aquestes dades. Els sistemes de TA es van avaluar amb una combinació de mètodes automàtics i humans per validar la qualitat dels RL recollits en el projecte i, més endavant, els RL de qualitat es van compartir amb el públic general a través del repositori ELRC-SHARE. L’article debat les dificultats més importants amb què ha topat aquest treball i s’hi subratlla la importància i els avantatges primordials de compartir RL digitals de qualitat
© 2008-2024 Fundación Dialnet · Todos los derechos reservados