Ir al contenido

Documat


Resumen de Estimación y aplicación de medidas de confianza en reconocimiento automático del habla

José Alberto Sanchis Navarro Árbol académico

  • En esta tesis se aborda el problema de la estimación y aplicación de medidas de confianza en reconocimiento automático del habla. Este problema es una de las líneas de investigación abiertas dentro del reconocimiento del habla y, en los últimos años, ha desperado un crecimiento interés por su utilidad.

    El objetivo es medir la fiabilidad de las palabras producto del reconocimiento, y detectar aquéllas que sean susceptibles de ser errores.

    En la tesis este problema se aborda como un problema clásico de clasificación en dos clases: correcta e incorrecta. Para ello, cada palabra se representa por un conjunto de características y, utilizando técnicas conocidas del reconocimiento de formas, se clasifica en una de las dos posibles clases.

    El trabajo de investigación se centra en dos frentes; por una parte, encontrar nuevas características que aporten información útil sobre la corrección de las palabras reconocidas, y por otra, definir un clasificador, dentro del marco estadístico, que obtenga resultados satisfactorios en la estimación de la medida de confianza.

    Se proponen cuatro nuevas características, las cuales se inspiran en observaciones que han sido utilizadas por otros autores. Una de ellas se basa en la variación de uno de los parámetros del reconocedor, denominado Grammar Scale Factor, y las otras tres se basan en la utilización de grafos de palabras. Así mismo, se propone una mejora computacional que trata de resolver el principal inconveniente de una de las características más útiles que aparecen en la literatura: Acoustic Stability.

    Respecto al clasificador, se adoptan dos modelos diferentes: el primero, es una de las aportaciones de la tesis, y consiste en un modelo probabilístico dependiente de la palabra, que estima la medida de confianza mediante la combinación naïve Bayes de características. Para tratar con el problema de escasez de datos de entrenamiento, el modelo se suaviza, utilizando t


Fundación Dialnet

Mi Documat