Ir al contenido

Documat


Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla

  • Autores: L. Ortega, Isabel Galiano, Lluís Felip Hurtado Oliver Árbol académico, Emilio Sanchís Arnal Árbol académico, Encarna Segarra Soriano Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 45, 2010, págs. 199-206
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      En este artículo presentamos un algoritmo para el aprendizaje estadístico de modelos semánticos, a partir de un corpus no alineado de pares de frases y su representación semántica en términos de frames. El objetivo final es poder asociar automáticamente segmentos de longitud variable con sus correspondientes unidades semánticas para ser usados en tareas de comprensión de habla. Una de las ventajas de esta aproximación consiste en evitar el costoso trabajo de segmentar y etiquetar todo el corpus de aprendizaje, como necesitan la mayor parte de los métodos basados en corpus. Por otra parte, resulta de especial interés la capacidad de aprendizaje discriminativo que presenta este método. Hemos aplicado este algoritmo al desarrollo del módulo de comprensión de un sistema de diálogo hablado, cuya tarea es el acceso a información sobre trenes. Se presentan experimentos que confirman lo adecuado del método, dado el ahorro de esfuerzo en la preparación del corpus.

    • English

      In this paper we present a algorithm for the statistical learning of semantic models, based on a corpus of unaligned pairs of sentences and semantic representations in terms of frames. The objective is automatically associate variable-length segments with their corresponding semantic labels to be used in speech understanding tasks. One advantage of this approach is to avoid the expensive work of segmenting and labeling the whole training corpus, process which is needed by almost all the corpus based methods. Moreover, the discrimination learning ability of this method is specially interesting. We have applied this algorithm to the development of the understanding module of a spoken dialog system, whose task is the access to information about trains. We present experiments that confirm the appropriateness of the methodology.

  • Referencias bibliográficas
    • Benedí, José-Miguel, Eduardo Lleida, Amparo Varona, Mar´ıa-Jos´e Castro, Isabel Galiano, Raquel Justo, Iñigo López de Letona, y Antonio Miguel....
    • De Mori, R., F. Bechet, D. Hakkani-Tur, M. McTear, G. Riccardi, y G. Tur. 2008. Spoken language understanding: A survey. IEEE Signal Processing...
    • Dempster, A. P., N. M. Laird, y D. B. Rubin. 1977. Maximum-likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistics...
    • Fraser, M. y G. Gilbert. 1991. Simulating speech systems. En Computer Speech and Language, volumen 5, p´aginas 81–99. Hahn, Stefan, Patrick...
    • He, Yulan y Steve Young. 2006. Spoken language understanding using the hidden vector state model. Speech Communication, 48:262–275.
    • Minker, W. 1999. Stocastically-based semantic analysis. En Kluwer Academic Pu- blishers, Boston, USA.
    • Pérez, Guillermo, Gabriel Amores, Pilar Manchón, Fernando G´omez, y Jes´us González. 2006. Integrating OWL Ontologies with a Dialogue Manager....
    • Raymond, C., F. Bechet, R. De Mori, y G. Damnati. 2006. On the use of finite state transducers for semantic interpretation. Speech Communication,...
    • Segarra, E., E. Sanchis, M. Galiano, F. García, y L. Hurtado. 2002. Extracting Semantic Information Through Automatic Learning Techniques....

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno