Ir al contenido

Documat


Resumen de Euskarazko izena+aditza konbinazioak corpusetik automatikokierauztea eta idiomatikotasunaren arabera karakterizatzea

Ainara Gurrutxaga, Iñaki Alegría Loinaz Árbol académico, Xabier Artola Zubillaga Árbol académico

  • Euskarazko izena+aditza egiturako unitate fraseologikoak (UFak) corpusetik automatikoki erauzi etaidiomatikotasun-mailaren arabera karakterizatzeko lan esperimentala egin dugu. Corpusetik hautagaiakerauzteko sistema landu ondoren, idiomatikotasunaren lau ezaugarri edo propietateetako bakoitzaneurtzeko teknikak garatu eta ebaluatu ditugu, hiru adituk eskuz sailkatutako erreferentzia erabiliz.Hiru kategoria bereizi dira: esapide idiomatikoa, kolokazioa eta konbinazio librea. Azkenik, ezaugarribakunen neurketak ikasketa automatikoko sailkatze-ataza batean konbinatu dira. Ondorio nagusiada arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla,batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketaren bidez ere.


Fundación Dialnet

Mi Documat