Ir al contenido

Documat


DiSeg: Un segmentador discursivo automático para el español

  • Autores: Iria da Cunha Fanego Árbol académico, Éric SanJuan, Juan Manuel Torres Moreno Árbol académico, Marina Lloberas, Irene Castellón Masalles Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 45, 2010, págs. 145-152
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      Hoy en día el análisis discursivo automático es un tema de investigación relevante. Sin embargo, no existen analizadores del discurso para textos en español. El primer paso para desarrollar esta herramienta es la segmentación discursiva. En este artículo presentamos DiSeg, el primer segmentador discursivo para el español que utiliza el marco de la Rhetorical Structure Theory (Mann y Thompson, 1988) y se basa en reglas léxicas y sintácticas. Describimos el sistema y evaluamos sus resultados con un corpus gold standard, obteniendo resultados prometedores.

    • English

      Nowadays discourse parsing is a very prominent research topic. However, there is not a discourse parser for Spanish texts. The first stage in order to develop this tool is discourse segmentation. In this work, we present DiSeg, the first discourse segmenter for Spanish that uses the framework of the Rhetorical Structure Theory (Mann and Thompson, 1988) and is based on lexical and syntactic rules. We describe the system and we evaluate its performance with a gold standard corpus, obtaining promising results.

  • Referencias bibliográficas
    • Afantenos, S., P. Denis, P. Muller y, L. Danlos (2010). “Learning Recursive Segments for Discourse Parsing”. En Proceedings of the Seventh...
    • Alonso, L. 2005. “Representing discourse for automatic text summarization via shallow NLP techniques”. Tesis doctoral. Barcelona: Universitat...
    • Carlson, L. y D. Marcu. 2001. Discourse Tagging Reference Manual. ISI Technical Report ISITR-545. Los Ángeles: University of Southern California. da...
    • Dale, R., E. Hovy, D. Rösner, y O. Stock (Eds.). 1992. Aspects of Automated Natural Language Generation. Berlín: Springer. Ghorbel, H., A....
    • Hovy, E. 1993. “Automated discourse generation using discourse structure relations”. Artificial Intelligence, 63. 341-385. Mann, W.C. y S.A....
    • Marcu, D. 2000a. The Theory and Practice of Discourse Parsing Summarization. Massachusetts: Institute of Technology.
    • Marcu, D. 2000b. “The Rhetorical Parsing of Unrestricted Texts: A Surface-based Approach”. Computational Linguistics, 26(3): 395-448.
    • Marcu, D., L. Carlson, y M. Watanabe. 2000. “The automatic translation of discourse structures”. En Proceedings of the 1st Meeting of the...
    • Mazeiro, E.G. y T.A.S. Pardo. 2009. “Metodologia de avaliação automática de estruturas retóricas”. En Proceedings of the 7th Brazilian Symposium...
    • O’Donnell, M. 2000. “RSTTOOL 2.4 – A Markup Tool for Rhetorical Structure Theory”. En Proceedings of the International Natural Language Generation...
    • O'Donnell, M., C. Mellish, J. Oberlander, y A. Knott. 2001. “ILEX: An architecture for a dynamic Hypertext generation system”. Natural...
    • Pardo, T.A.S. y L.H.M. Rino. 2002. “DMSumm: Review and assessment”. En Proceedings of Advances in Natural Language Processing, Third International...
    • Pardo, T.A.S., M.G.V. Nunes, y L.H.M. Rino. 2004. “DiZer: An Automatic Discourse Analyzer for Brazilian Portuguese”. Lecture Notes in Artificial...
    • T.A.S. Pardo y M.G.V. Nunes. 2008. “On the Development and Evaluation of a Brazilian Portuguese Discourse Parser”. Journal of Theoretical...
    • Radev, D. 2000. “A common theory of information fusion from multiple text sources. Step one: Cross document structure”. En L. Dybkjær, K....
    • Sumita, K., K. Ono, T. Chino, T. Ukita, y S. Amano. 1992. “A discourse structure analyzer for Japonese text”. En Proceedings of the International...
    • Taboada, M. Y W.C. Mann. 2005. “Applications of rhetorical structure theory”. Discourse Studies, 8(4): 567-588.
    • Tofiloski, M., J. Brooke y M. Taboada. 2009. “A Syntactic and Lexical-Based Discourse Segmenter”. En Proceedings of the 47th Annual Meeting...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno