Ir al contenido

Documat


Resumen de Rol semantikoen etiketatze automatikoa: rol multzoak eta hautapen murriztapenak

Beñat Zapirain Sierra Árbol académico

  • euskara

    Tesi honetan, Rolen Sailkatze Automatikoan (RSA) aski ezagunak diren bi arazo izan ditugu aztergai: (1) Rol multzo ezberdinen egokitasuna praktikan, eta (2) RSArako sistemek darabiltzaten ezaugarri lexikalen eragin mugatua eta pairatzen duten sakabanaketa. Lehen puntuari dagokionez, gaur egun gure arloan gehien erabiltzen diren PropBank eta VerbNeteko rol multzoen azterketa konparatibo sakona aurkeztuko dugu, rol multzo bakoitzarekin entrenatutako sailkatzaileen errendimendua, sendotasuna, eta orokortzeko gaitasuna, esperimentazio ingurune eta domeinu ezberdinetan neurtuz. Bigarren puntuari dagokionez, ezaugarri lexikoek planteatzen dituzten arazoak aztertuko ditugu eta, WordNet eta antzekotasun distribuzionaleko neurriekin sortutako hautapen murriztapenak erabiliz, arazo horien eragina modu esanguratsuan leunduko dugu. In-vitro egindako esperimentuekin, hautapen murriztapen horiek lexikotik eratorritako ezaugarriek baino sailkatze ahalmen handiagoa dutela ikusiko dugu. Azkenik, hautapen murriztapenetatik erauzitako ezaugarriak baliatuz, artearen egoeran dagoen RSA sistema baten errendimendua hobetuko dugu (domeinu barnean eta domeinuz kanpo).

  • English

    This thesis focuses on two well-known open issues in Semantic Role Classi fication (SRC) research: (1) the suitability of diferent role inventories in practice, and (2) the limited in uence and sparseness of lexical features.

    About the former, we present an empirical comparative study on the use of PropBank vs. VerbNet roles, the two most widely used role inventories, testing the performance diferences for unseen verbs and the robustness for new corpus domains. About the latter, we test the use of automatically learnt selectional preferences as a complement to lexical features, proposing both WordNet-based and distributional similarity based models. We show that all our selectional preference models improve over lexical features in in-vitro experiments, and that the models are complementary. Finally, we show that incorporating features based on selectional preferences, the overall performance of an state-of-the-art SRC system improves both in in-domain and out-of-domain corpora.


Fundación Dialnet

Mi Documat