Ir al contenido

Documat


Resumen de Bruja: un sistema de búsqueda de respuestas multilingüe

Miguel Ángel García Cumbreras Árbol académico

  • Dentro de los sistemas de procesamiento de lenguaje natural y de la recuperación de información -Sal 1983- encontramos los sistemas de búsqueda de respuestas.

    La búsqueda de respuestas se puede definir como el proceso automático que realizan los ordenadores para encontrar respuestas concretas a preguntas precisas formuladas por los usuarios -Bur 2000-.

    Los sistemas BR no solo localizarían los documentos o pasajes relevantes (dentro de una colección documental o de información no estructurada), sino que también encuentran, extraen y muestran la respuesta al usuario final, evitándole la búsqueda o la lectura d la información relevante para encontrar de forma manual la respuesta final.

    Los componentes principales de un sistema de BR son -Har 2000-.

    -análisis de la pregunta -recuperación de documentaos o pasajes relevantes -extracción de respuestas Actualmente existen sistemas que intentan encontrar respuestas a preguntas formuladas por el usuario utilizando un único idioma para las colecciones y cualquier idioma para la pregunta, de formas que solo es necesario aplicar una traducción del idioma de la pregunta al idioma de las colecciones para trabajar en modo monolingüe-Gre 1998-.

    Se investiga y desarrolla un sistema de búsqueda de respuestas multilingüe, denominado bruja (búsqueda de respuestas en la universidad de Jaén) .

    Se utiliza el concepto "multilingüe" en su totalidad o CLIR (del inglés Cross Language Information Retriaeval)-Mar 2004b-. Esto implica de forma general la aceptación de preguntas en cualquiera de los idiomas utilizados, el uso de colecciones en varios idiomas y la devolución de la respuesta o respuestas finales en el mismo idioma de la pregunta.

    Se investiga, desarrolla y prueba varias soluciones posibles para los diversos módulos de este sistema e integrarlos en una solución final. La versión definitiva del sistema trabajaría en tres idiomas: inglés, español y francés, siendo posible su posterior ampliación a otros idiomas.


Fundación Dialnet

Mi Documat