Ir al contenido

Documat


Resumen de Representación de páginas web a través de sus enlaces y su aplicación a la recuperación de información

José Luis Alonso Berrocal Árbol académico, Luis Carlos García de Figuerola Paniagua Árbol académico, Ángel Francisco Zazo Rodríguez Árbol académico

  • Los sistemas más habituales de Recuperación de la Información se basan en conseguir una representación homogénea y procesable de documentos y consultas, y en el cálculo subsiguiente de alguna función que exprese el grado de similaridad entre una consulta dada y cada uno de los documentos de una colección. Por regla general, tales representaciones toman como base las palabras o términos que aparecen en los documentos. Las páginas web, sin embargo, contienen hiperenlaces, lo que sugiere la posibilidad de representar dichas páginas en función de tales hiperenlaces, en lugar de términos. Se describe un experimento exploratorio efectuado para estimar la viabilidad de esta hipótesis. Los resultados de dicho experimento sugieren que los hiperenlaces pueden ser aplicados ventajosamente en la representación de las páginas web, pero también que es preciso definir y aplicar mecanismos correctores


Fundación Dialnet

Mi Documat