Discourse marker characterisation via clustering : extrapolation from supervised to unsupervised corpora
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1737
Título: | Discourse marker characterisation via clustering : extrapolation from supervised to unsupervised corpora |
---|---|
Autor/es: | Alonso Alemany, Laura | Castellón Masalles, Irene | Gibert Oliveras, Karina | Padró Cirera, Lluís |
Palabras clave: | Marcadores del discurso | Clustering | Discurso | Discourse markers | Discourse |
Fecha de publicación: | sep-2002 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | ALONSO ALEMANY, Laura, et al. “Discourse marker characterisation via clustering : extrapolation from supervised to unsupervised corpora”. Procesamiento del lenguaje natural. Nº 29 (sept. 2002), pp. 223-230 |
Resumen: | En este artículo mostraremos cómo las técnicas de clustering pueden aportar evidencia empírica para una caracterización de los Marcadores del Discurso (DMs) que contribuya a superar la falta de consenso y reduzca el coste de construcción de los recursos de PLN basados en DMs. Hemos establecido una noción de prototipicalidad de DMs comparando las clasificaciones de corpus anotado manualmente y automáticamente, a partir de la cual podemos obtener clasificaciones fiables a partir de corpus anotado automáticamente. | In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora. |
Patrocinador/es: | This research has been conducted thanks to a grant associated to the X-TRACT project, PB98-1226 of the Spanish Research Department. It has also been partially funded by projects HERMES (TIC2000-0335-C03-02) and PETRA (TIC2000-1735-C02-02). |
URI: | http://hdl.handle.net/10045/1737 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 29 (septiembre 2002) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_29_28.pdf | 1,08 MB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.