Ir al contenido

Documat


Discourse marker characterisation via clustering: extrapolation from supervised to unsupervised corpora

  • Autores: Karina Gibert Oliveras Árbol académico, Lluís Padró Cirera Árbol académico, Irene Castellón Masalles Árbol académico, Laura Alonso Alemany Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 29, 2002 (Ejemplar dedicado a: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002), págs. 223-230
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      En este artículo mostraremos cómo las técnicas de clustering pueden aportar evidencia empírica para una caracterización de los Marcadores del Discurso (DMs) que contribuya a superar la falta de consenso y reduzca el coste de construcción de los recursos de PLN basados en DMs. Hemos establecido una noción de prototipicalidad de DMs comparando las clasificaciones de corpus anotado manualmente y automáticamente, a partir de la cual podemos obtener clasificaciones fiables a partir de corpus anotado automáticamente.

    • English

      In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno