Ir al contenido

Documat


Diseño y comparación de varias aproximaciones estadísticas a la Comprensión del Habla en dos tareas e idiomas distintos

  • Autores: Fernando García Granada Árbol académico, Marcos Calvo Lance, Lluís Felip Hurtado Oliver Árbol académico, Emilio Sanchís Arnal Árbol académico, Encarna Segarra Soriano Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 55, 2015, págs. 31-38
  • Idioma: español
  • Títulos paralelos:
    • Design and comparison of several statistical approaches to Speech Understanding in two different tasks and languages
  • Enlaces
  • Resumen
    • español

      En este artículo se presenta un estudio de diversas aproximaciones al problema de la comprensión del habla en dominios semánticos restringidos. Se proponen dos sistemas basados en modelos generativos y se comparan con un sistema basado en un método discriminativo. La experimentación se ha realizado sobre dos tareas diferentes, DIHANA y MEDIA, que a su vez están en dos idiomas diferentes. El uso de las dos tareas tiene interés no sólo por las diferencias en la forma de expresar los conceptos en los dos idiomas, sino también por las diferencias en la forma de representar la semántica. Los resultados muestran la capacidad de los modelos estadísticos aprendidos automáticamente para representar la semántica, incluso cuando se trata con voz, que introduce errores generados en el proceso de reconocimiento.

    • English

      In this paper, a study of different approaches to the problem of speech understanding in restricted semantic domains is presented. Two systems based on generative models are proposed and they are compared with a system based on discriminative methods. The experiments were conducted on two different tasks, DIHANA and MEDIA, which are in two different languages. The use of the two tasks is of interest not only because of the differences in how concepts are expressed in both languages, but also because of the differences in the way of representing the semantics. The results show the ability of automatically learned statistical models to represent the semantics, even when dealing with voice input, which introduces errors that are generated in the recognition process.

  • Referencias bibliográficas
    • Benedí, J.M., E. Lleida, A. Varona, M.J. Castro, I. Galiano, R. Justo, I. López de Letona, y A. Miguel. 2006. Design and acquisition of a...
    • Bonneau-Maynard, H., S. Rosset, C. Ayache, A. Kuhn, y D. Mostefa. 2005. Semantic annotation of the French MEDIA dialog corpus. En Proc. of...
    • Calvo, M., F. García, L.-F. Hurtado, S. Jiménez, y E. Sanchis. 2013. Exploiting multiple hypotheses for multilingual spoken language understanding....
    • Dinarelli, M., A. Moschitti, y G. Riccardi. 2009. Concept Segmentation And Labeling For Conversational Speech. En Interspeech, Brighton.
    • Esteve, Y., C. Raymond, F. Bechet, y R. De Mori. 2003. Conceptual Decoding for Spoken Dialog systems. En Proc. of EuroSpeech’03, páginas 617–620.
    • García, F., L.-F. Hurtado, E. Segarra, E. Sanchis, y G. Riccardi. 2012. Combining multiple translation systems for Spoken Language Understanding...
    • Hahn, S., M. Dinarelli, C. Raymond, F. Lef`evre, P. Lehnen, R. De Mori, A. Moschitti, H. Ney, y G. Riccardi. 2010. Comparing stochastic...
    • He, Y. y S. Young. 2003. A data-driven spoken language understanding system. En Proc. of ASRU’03, páginas 583–588. Hurtado, L., E. Segarra,...
    • Lafferty, J., A. McCallum, y F. Pereira. 2001. Conditional random fields: Probabilistic models for segmenting and labeling sequence data....
    • Laguna, S., M. Giménez, M. Calvo, F. García, E. Segarra, E. Sanchis, y L.-F. Hurtado. 2014. A Multilingual Spoken Language Understanding System....
    • Lef`evre, F. 2007. Dynamic bayesian networks and discriminative classifiers for multi-stage semantic interpretation. En ICASSP 2007, volumen...
    • Ortega, L., I. Galiano, L.-F. Hurtado, E. Sanchis, y E. Segarra. 2010. A statistical segment-based approach for spoken language understanding....
    • Raymond, C. y G. Riccardi. 2007. Generative and discriminative algorithms for spoken language understanding. Proc. of Interspeech 2007, páginas...
    • Segarra, E., E. Sanchis, M. Galiano, F. García, y L. Hurtado. 2002. Extracting Semantic Information Through Automatic Learning Techniques....
    • Seneff, S. 1992. TINA: A natural language system for spoken language applications. Computational Linguistics, 1(18):61–86.
    • Servan, C., N. Camelin, C. Raymond, F. Béchet, y R. De Mori. 2010. On the use of Machine Translation for Spoken Language Understanding portability....
    • Ward, W. y S. Issar. 1994. Recent improvements in the CMU spoken language understanding system. En Proc. of the ARPA Human Language Technology...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno