Euskarazko izena+aditza egiturako unitate fraseologikoak (UFak) corpusetik automatikoki erauzi etaidiomatikotasun-mailaren arabera karakterizatzeko lan esperimentala egin dugu. Corpusetik hautagaiakerauzteko sistema landu ondoren, idiomatikotasunaren lau ezaugarri edo propietateetako bakoitzaneurtzeko teknikak garatu eta ebaluatu ditugu, hiru adituk eskuz sailkatutako erreferentzia erabiliz.Hiru kategoria bereizi dira: esapide idiomatikoa, kolokazioa eta konbinazio librea. Azkenik, ezaugarribakunen neurketak ikasketa automatikoko sailkatze-ataza batean konbinatu dira. Ondorio nagusiada arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla,batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketaren bidez ere.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados