Ir al contenido

Documat


"Website term browser", un sistema interactivo y multilingüe de búsqueda textual basado en técnicas lingüísticas

  • Autores: Anselmo Peñas Padilla Árbol académico
  • Directores de la Tesis: Julio Gonzalo Arroyo (dir. tes.) Árbol académico, María Felisa Verdejo Maíllo (dir. tes.) Árbol académico
  • Lectura: En la UNED. Universidad Nacional de Educación a Distancia ( España ) en 2002
  • Idioma: español
  • Tribunal Calificador de la Tesis: Horacio Rodríguez Hontoria (presid.) Árbol académico, Manuel de Buenaga Rodríguez (secret.) Árbol académico, Ana M. García Serrano (voc.) Árbol académico, Piek Vossen (voc.) Árbol académico, Raquel Martínez Unanue (voc.) Árbol académico
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • Los sistemas de búsqueda han adquirido una gran importancia en el uso cotidiano de los ordenamientos, Sin embargo, la recuperación de información textual tiene asociada una serie de problemas todavaía no resueltos satisfactoriamente.

      Algunos de estos problemas provienen de las características del lenguaje natural. Por esta razón, diversos autores se han interesado en la aplicación de técnicas lingüísticas automáticas a la recuperación de información, obteniendo resultados que hasta la fecha no son plenamente satisfactorios y que cuestionan la utilidad de estas técnicas en la búsqueda textual.

      En este trabajo se abordan los problemas de ambigüedad léxica, variación terminológica y translingüísmo en el acceso a la información, con la siguiente línea argumental:

      1,- Estudio del papel de las técnicas lingüísticas en el modelo tradicional de recuperación y ordenación de documentos.

      2,- Transición a un modelo interactivo en el que los resultados parciales del procesamiento lingüístico se ofrecen al usuario como caminos alternativos de contextualización de la consulta y de acceso a la información.

      3,- Creación de un marco en el que sea posible la evaluación de estos sistemas interactivos de acceso a la información.

      La primera parte muestra una serie de experimentos de recuperación con el fin de discernir si la falta de buenos resultados se debe a los errores que introduce el procesamiento automático o si se debe a que las técnicas lingüísticas no resultan estrategias adecuadas en un modelo tradicional de recuperación de documentos. Estos experimentos se han llevado a cabo sobre una colección etiquetada manualmente en todos los niveles léxicos.

      De esta forma, los resultados de recuperación quedan libres de los errores de un procesamiento automático permitiendo determinar si las técnicas lingüísticas (en una situación ideal) suponen o no estrategias adecuadas para mejorar la recuperación. L


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno