Lara Gil Vallejo, Irene Castellón Masalles , Marta Coll-Florit, Jordi Turmo
En este trabajo nos centramos en la adquisición de clasificaciones verbales automáticas para el español. Para ello realizamos una serie de experimentos con 20 sentidos verbales del corpus Sensem. Empleamos diferentes tipos de atributos que abarcan información lingüística diversa y un método de clustering jerárquico aglomerativo para generar varias clasificaciones. Comparamos cada una de estas clasificaciones automáticas con un gold standard creado semi-automáticamente teniendo en cuenta construcciones lingüísticas propuestas desde la lingüística teórica. Esta comparación nos permite saber qué atributos son más adecuados para crear de forma automática una clasificación coherente con la teoría sobre construcciones y cuales son las similitudes y diferencias entre la clasificación verbal automática y la que se basa en la teoría sobre construcciones lingüísticas.
In this work we focus on the automatic acquisition of verbal classifications for Spanish. To do so, we perform a series of experiments with 20 verbal senses that belong to the Sensem corpus. We use different kinds of features that include diverse linguistic information and an agglomerative hierarchical clustering method to generate a number of classifications. We compare each of these automatic classifications with a semi-automatically created gold standard, which is built on the basis of linguistic constructions proposed by theoretical linguistics. This comparison allows us to investigate which features are adequate to build a verb classification coherent with linguistic constructionstheory and which are the similarities and differences between an automatic verbal classification and a verb classification based on the theory of linguistic constructions.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados