María Teresa Escrig Monferrer , Francisco Casacuberta Nolla
Actualmente son necesarias interfaces en las cuales la comunicación entre el ser humano y las computadores sea eficiente, natural y que no requiera un gran esfuerzo de aprendizaje. En ello trabaja la línea de investigación "Reconocimiento Automático del Habla". En este trabajo se describe un sistema para el Reconocimiento de Palabras Aisladas (RPA) para vocabularios reducidos, independiente del locutor y se muestran los resultados de su implementación en una estación de trabajo HP-9000, sobre la que el sistema funciona en tiempo real.
A partir de la señal vocal (en nuestro caso una palabra aislada del vocabulario), se obtiene una representación paramétrica de dicha señal en la etapa denominada preproceso, en el cual se realiza un tratamiento mediante Banco de Filtros, un cálculo del cepstrum y un etiquetado, que reducirá la cantidad de información con la que tratar y enfatizará las características más relevantes de la señal.
Señales así parametrizadas serán utilizadas para el aprendiaje de un Modelo de Markov Oculto (MMO) para cada palabra del vocabulario. Para el reconocimiento se tomarán muestras igualmente parametrizadas y se calculará la probabilidad de generar dicha muestra por cada uno de los modelos, eligiéndose como palabra aquella cuyo modelo dé la probalibidad más alta.
El sistema permite, además, la posibilidad de generación de nuevas tareas, aprendiendo los modelos de cualquier vocabulario
Nowardays it is needed interfaces in which human-computer comunication is efficient, natural and that don't require a large effort of training. The line of investigation "Speech Automatic Recognition" is working in this subjet. In this work we show a Speaker-Independent, Isolated Word Recognizer for small vocabularies, and we show the implementation results on a workstation HP-9000, in real time.
We obtain a parametric representation from a speech signal (in our case an isolated word of the vocabulary) in a preprocessing stage in which a filter-bank treatment, a cepstrum calculation and a labelling are made. This wil reduce the amount of information to be treated and wil emphasize the most outstanding signal features.
This parametric signal will be used for training a distinct Hidden Markov Model (HMM) for each word of the vocabulary. Recognition consists of computing the probability of generating the test word with each model and choosing the word whose model gives the highest probility.
This system alows us to generate new tasks to train models of other vocabulary.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados