Ir al contenido

Documat


Consultas Degradadas en Recuperación de Información Textual

  • Autores: Juan Otero Pombo, Jesús Vilares Árbol académico, Manuel Vilares Ferro Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 42, 2009, págs. 9-16
  • Idioma: español
  • Títulos paralelos:
    • Corrupted Queries in Text Retrieval
  • Enlaces
  • Resumen
    • español

      En este artículo proponemos dos alternativas para el tratamiento de consultas degradadas en aplicaciones de Recuperación de Información en español. La primera de ellas es una estrategia basada en n-gramas de caracteres e independiente del conocimiento y recursos lingüísticos disponibles. Como segunda alternativa, proponemos a su vez dos técnicas de corrección ortográfica, integrando una de ellas un modelo estocástico que debe ser entrenado previamente a partir de un texto etiquetado. Con el fin de estudiar su validez, se ha diseñado un marco de pruebas sobre el que se han evaluado ambas aproximaciones.

    • English

      In this paper, we propose two different alternatives to deal with degraded queries on Spanish Information Retrieval applications. The first is based on character n-grams, and has no dependence on the linguistic knowledge and resources available. In the second, we propose two spelling correction techniques, one of which has a strong dependence on a stochastic model that must be previously built from a PoStagged corpus. In order to study their validity, a testing framework has been designed and applied on both approaches for evaluation.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno