Ir al contenido

Documat


Resumen de IR-n: un sistema de recuperación de información basado en pasajes

Fernando Llopis Pascual Árbol académico

  • En este trabajo se ha presentado un nuevo modelo de Recuperación de Información basado en pasajes. A este sistema se le ha denominado IR-.n.

    El principal objetivo de los sistemas de RI es localizar los documentos que son relevantes a una pregunta. Para determinar esta relevancia los sistemas de RI buscan los términos de la pregunta dentro del documento y posteriormente utilizan unas métricas adicionales para valorar dichar relevancia.

    Los sistemas de RI basados en pasajes (RP) realizan dicha búsqueda en unos fragmentos de texto contiguo denominados pasajes. El sistema IR-n define un nuevo modelo de pasajes y una serie de métricas que permiten mejorar la eficacia del proceso. La evaluación del sistema IR-n se realizó en las conferencias CLEF.

    El sistema IR-n, es un modelo de RP, que diferencia claramente del resto, principalmente, por la unidad que utiliza para definir los pasajes en los que se divide el documento: la frase.

    Se han analizado las ventajas que supone el uso de la frase como unidad de definición de los paisajes, dentro de la problemática de la RI. Las principales son:

    * Los límites que definen una frase dentro de un documento se pueden obtener fácilmente aunque no se disponga de marcas en el documento que las identifiquen.

    * Los pasajes generados en base a un número de frases, están dotados de entidad sintáctica. Esta característica ha sido de gran utilidad en el uso del sistema como paso previo a la aplicación de un sistema de Búsqueda de Respuestas (BR).

    * Permiten incorporar de forma sencilla el concepto de solapamiento en la definición de los pasajes.

    * Permite valorar, en el cálculo de relevancia, el hecho de que los términos que forman la pregunta aparezcan en una misma unidad como es la frase.

    Las principales aportaciones de este trabajo son las siguientes:

    * Estudio y clasificación de los sistemas de RI más importantes.

    * Propuesta de un nuevo modelo de RP.

    * Evaluaci


Fundación Dialnet

Mi Documat