Ir al contenido

Documat


Resumen de Estrategias para el acceso a contenidos Web mediante habla

César González Ferreras Árbol académico

  • El objetivo de la tesis es diseñar y evaluar diferentes estrategias para el acceso a contenidos web empleando habla, El trabajo se ha centrado en la reutilización de los contenidos web existentes y en plantear la interacción hablada de manera que el usuario pueda acceder a los contenidos de manera rápida y amigable. El trabajo realizado se ha dividido en tres partes. En la primera fase se ha analizado el problema de la conversión genérica de contenidos web para su acceso a través de un navegador vocal y se han propuesto dos alternativas: la conversión automática y la conversión semiautomática. En ambos casos, la forma de acceso está condicionada por la manera en la que están estructurados los contenidos web originales. En la segunda fase se ha planteado la utilización de un sistema de diálogo hablado para el acceso a contenidos web en dominios restringidos. La propuesta está basada en un modelo de información, que describe cómo se deben procesar y estructurar los contenidos web, y en un modelo de interacción, que describe cómo el sistema dialoga con el usuario empleando navegación y búsqueda. Se ha construido un sistema que permite acceder al sitio web de un periódico digital empleando habla. Sin embargo, se han detectado ciertas limitaciones en la estrategia de búsqueda, provocadas por los errores de reconocimiento del habla. Esto ha motivado una tercera y última fase en la que se han realizado diversos experimentos con un sistema de recuperación de información dirigida por habla. Se han propuesto varias mejoras que permiten incrementar el rendimiento del sistema: la adaptación dinámica del vocabulario y del modelo de lenguaje; la utilización de realimentación por pseudo-relevancia en el motor de recuperación de información; y la inclusión de la pronunciación de palabras en inglés. Los experimentos finales han demostrado la viabilidad de construir sistemas de recuperación de información dirigida por habla, aunque el rendimiento no es tan bueno como el obtenido al emplear texto como entrada.


Fundación Dialnet

Mi Documat