Ir al contenido

Documat


Resumen de Discourse marker characterisation via clustering: extrapolation from supervised to unsupervised corpora

Karina Gibert Oliveras Árbol académico, Lluís Padró Cirera Árbol académico, Irene Castellón Masalles Árbol académico, Laura Alonso Alemany Árbol académico

  • español

    En este artículo mostraremos cómo las técnicas de clustering pueden aportar evidencia empírica para una caracterización de los Marcadores del Discurso (DMs) que contribuya a superar la falta de consenso y reduzca el coste de construcción de los recursos de PLN basados en DMs. Hemos establecido una noción de prototipicalidad de DMs comparando las clasificaciones de corpus anotado manualmente y automáticamente, a partir de la cual podemos obtener clasificaciones fiables a partir de corpus anotado automáticamente.

  • English

    In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora.


Fundación Dialnet

Mi Documat