Antonio Ferrández Rodríguez , José-Luis Vicedo González , Fernando Llopis Pascual
Trabajos previos demuestran que la utilización de fragmentos de documentos como unidad básica de información, para calcular la relevancia de un documento con respecto a una pregunta, mejora sensiblemente los resultados de los sistemas de recuperación de información. Sin embargo, no se ha llegado a un consenso acerca de cómo definir esos fragmentos de texto (o párrafos) de forma que el sistema alcance un comportamiento óptimo. El presente artículo presenta un sistema de recuperación de información, basado en la definición de pasajes de tamaño variable. Cada pasaje está formado por un número determinado de las frases que forman el documento. El número de frases seleccionadas para cada pasaje dependerá de la localización de las palabras de la pregunta en cada documento. La evaluación realizada permite comparar el rendimiento de este modelo con un sistema estándar de recuperación de documentos, así como con otras propuestas que utilizan diferentes métodos de definición de pasajes.
Previous works show that the use of fragments of documents as the basic unit of information to calculate the relevance of a document with regard to a query, improves the results of information retrieval systems. However, it has not been agreed how these fragments of texts should be obtained in order to obtain optimum results. This paper presents an information retrieval system that is based on the definition of passages of variable size. Each passage is formed by a number of sentences that formed the document. The number of sentences by each passage will depend on the position of the query words in each document. The accomplished evaluation allows comparing the performance of this model with a standard information retrieval system, as well as with other passage retrieval systems.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados