Ir al contenido

Documat


Localización de Palabras basadas en Grafos de Fonemas

  • Autores: Jon Ander Gómez Árbol académico, Marcos Calvo Lance, Emilio Sanchís Arnal Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 44, 2010, págs. 59-66
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      En este artículo se propone la utilización de grafos de fonemas para tareas de detección y localización de palabras en documentos hablados. Los grafos de fonemas propuestos se construyen a partir de probabilidades fonéticas calculadas frame a frame. También se propone un modelo de error sobre los grafos de fonemas que permite simplificar los algoritmos de exploración que buscan secuencias fonéticas. Se aplica un modelo de duración de fonemas para reducir falsos positivos que penaliza adecuadamente la detección de secuencias fonéticas en intervalos temporales demasiado cortos.

    • English

      In this paper we propose the use of phoneme graphs for word spotting tasks. The proposed phoneme graphs are built using phonetic probabilities estimated at frame level. We also propose an error model on phoneme graphs which allows to simplify the exploration algorithms used for finding phonetic sequences. A phoneme duration model is also applied for avoiding the detection of too short phonetic sequences, which helps to reduce the number of false positive detections.

  • Referencias bibliográficas
    • Amir, Arnon, Alon Efrat, y Savitha Srinivasan. 2001. Advances in phonetic word spotting. En CIKM ’01: Proceedings of the tenth international...
    • Duda, R. O., P. E. Hart, y D. G. Stork. 2001. Pattern Classification. John Wiley and Sons, second edición. Garofolo, John, Cedric G. P. Auzanne,...
    • Ellen M. Voorhees. 2000. The trec spoken document retrieval track: A success story. En Text Retrieval Conference (TREC) 8, páginas 16–19.
    • Gómez, J.A. y M.J. Castro. 2002. Automatic Segmentation of Speech at the Phonetic Level. En Structural, Syntactic, and Statistical Pattern...
    • Gómez, J.A., M.J. Castro, y E. Sanchis. 2002. Construcción de grafos de fonemas para un sistema de RAH desacoplado. En II Jornadas en Tecnolog´ıa...
    • Moreno, A., D. Poch, A. Bonafonte, E. Lleida, J. Llisterri, J. B. Mariño, y C. Nadeu. 1993. Albayzin Speech Database: Design of the Phonetic...
    • Ng, K. y V. Zue. 1998. Phonetic recognition for spoken document retrieval. En ICASSP, p´aginas 325–328.
    • Rastrow, Ariya, Abhinav Sethy, Bhuvana Ramabhadran, y Frederick Jelinek. 2009. Towards using hybrid word and fragment units for vocabulary...
    • Saraclar, Murat y Richard Sproat. 2004. Lattice-based search for spoken utterance retrieval. En HLT-NAACL 2004: Main Proceedings, p´aginas...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno