Ir al contenido

Documat


Resumen de Personalizing XML information retrieval

Ricardo Alberto López Narváez

  • El objetivo principal de esta tesis doctoral es la personalización de la recuperación de información (RI) estructurada (XML). Esto es, adaptar los resultados de búsqueda a los gustos y preferencias de cada usuario, con el objetivo de satisfacer sus necesidades de información de una manera más sencilla, eficaz y rápida. La RI estructurada, y por ende también su personalización, tiene algunas complicaciones frente a la RI no estructurada, como p.e. los solapamientos entre unidades estructurales. Aún así, todas o casi todas las técnicas desarrolladas son también fácilmente aplicables a la RI no estructurada.

    Más concretamente nos marcamos como objetivo realizar aportaciones en cada una de las tres principales fases de cualquier proceso de personalización: - Perfiles de usuario: un perfil de usuario representa, de la mejor forma posible, los gustos y preferencias de dicho usuario. Hemos desarrollado y evaluado seis diferentes representaciones de perfiles de usuario simulados basados en contenido, usando términos y materias (conceptos). Este tipo de perfiles de usuario han demostrado ser muy útiles en entornos donde la privacidad del usuario es muy importante y en entornos de evaluación de simulaciones contextuales.

    - Técnicas de personalización: una técnica de personalización intenta sacar el máximo provecho a la información contenida en el perfil de usuario, para presentar los resultados que más se adapten a éste. Hemos desarrollado y evaluado un total de 14 diferentes técnicas de personalización, que se enfocan tanto antes (expansión de consultas), como dentro (modificación del motor de búsqueda), así como después (reranking) de la ejecución de la búsqueda. Estas técnicas hacen uso de características destacables, tales como el uso de dos listas de resultados en el proceso de reranking, o el uso de consultas CAS (contenido y estructura), que hasta donde sabemos, hemos sido los primeros en usarlas en el ámbito de la personalización.

    - Evaluación de la personalización: este es un proceso muy complejo ya que entran en juego factores subjetivos, como la relevancia de cada usuario. Hemos desarrollado una estrategia automática para la evaluación de sistemas de RI personalizados, denominada ASPIRE. Esta estrategia convierte la evaluación de estos sistemas en un proceso sencillo, rápido y eficaz, con el único requisito de tener una colección documental (parcialmente) clasificable en distintas áreas de interés.

    Para la evaluación de los tres puntos anteriores se ha usado una colección documental formada por los documentos oficiales del Parlamento de Andalucía. Se llevó a cabo un estudio de usuario con una serie de consultas reales con el fin de obtener los juicios de relevancia personalizados. Teniendo en cuenta estos juicios de relevancia se han conseguido mejoras de hasta el 84,5%, mediante el uso de la mejor representación del perfil de usuario y técnica de personalización, frente al rendimiento del sistema sin usar personalización. ASPIRE también ha demostrado ser una estrategia robusta y fiable, ya que arroja resultados altamente correlacionados con aquellos proporcionados por los usuarios reales en el estudio de usuario.


Fundación Dialnet

Mi Documat