En este artículo se propone la utilización de grafos de fonemas para tareas de detección y localización de palabras en documentos hablados. Los grafos de fonemas propuestos se construyen a partir de probabilidades fonéticas calculadas frame a frame. También se propone un modelo de error sobre los grafos de fonemas que permite simplificar los algoritmos de exploración que buscan secuencias fonéticas. Se aplica un modelo de duración de fonemas para reducir falsos positivos que penaliza adecuadamente la detección de secuencias fonéticas en intervalos temporales demasiado cortos.
In this paper we propose the use of phoneme graphs for word spotting tasks. The proposed phoneme graphs are built using phonetic probabilities estimated at frame level. We also propose an error model on phoneme graphs which allows to simplify the exploration algorithms used for finding phonetic sequences. A phoneme duration model is also applied for avoiding the detection of too short phonetic sequences, which helps to reduce the number of false positive detections.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados