Ir al contenido

Documat


Resumen de Aplicación del procesamiento de lenguaje natural en la recuperación de información

Yenory Rojas, Antonio Ferrández Rodríguez Árbol académico, Jesús Peral Cortés Árbol académico

  • español

    En este articulo se presenta un modelo innovador para la Recuperación de Información monolingüe en inglés y español. El modelo usa técnicas de Procesamiento de Lenguaje Natural (un etiquetador de categorías gramaticales -POS tagger-, un analizador sintáctico parcial y un módulo para la resolución de la anáfora) para mejorar la precisión de los sistemas tradicionales de Recuperación de Información; para ello, se realiza una indexación de las 'entidades' y las "relaciones entre estas entidades en los documentos. Pasa la evaluación del modelo se ha utilizado los corpus CLEF en español e inglés. Para las preguntas en inglés, se ha obtenido una mejora de 35,11% en la precisión media. Para las preguntas en español, el aumento máximo es de 37,18%.

  • English

    In this paper, a novel model for monolingual Information Retrieval in English and Spanish language is proposed. This model uses Natural Language Processing techniques (a POStagger, a Partial Parser, and an Anaphora Resolver) in order to improve the precision of traditional IR systems, by means of indexing the ¿entities¿ and the ¿relations¿ between these entities in the documents. This model is evaluated on the Spanish and English CLEF corpora. For the English queries, there is a maximum increase of 35.11% in the average precision. For the Spanish queries, the maximum increase is 37.18%


Fundación Dialnet

Mi Documat