Ir al contenido

Documat


Resumen de Federated query processing for the semantic web

Carlos Buil Aranda

  • En los últimos años se ha experimentado un crecimiento constante en los datos modelados en RDF. Este crecimiento está basado en la cada vez más frecuente publicación de datos en la Web. Estos datos son publicados por organizaciones de todo tipo, desde gobiernos (como el gobierno de los EEUU o del Reino Unido, con sus iniciativas data.gov y data.gov.uk respectivamente) a usuarios finales o redes de sensores distribuídas a lo largo del globo. Estos datos son normalmente creados en un formato diferente a RDF pero rápidamente traducidos a él, y además son expuestos en la Web mediante SPARQL endpoints y URLs enlazadas.

    Dado este contínuo crecimiento de datos en RDF que estamos experimentando, empiezan a aparecer herramientas para consultar dichos datos. Sin embargo, estas herramientas difieren en la forma de gestionar y presentar a los usuarios estas consultas. Para solucionar esta heterogeneidad de herramientas, el World Wide Web Consortium está definiendo una extensión al estándar de consultas SPARQL para permitir la federación de dichas consultas. Esta extensión permite combinar, en una sola consulta, patrones SPARQL que pueden ser evaluados en distintos almacenes de datos RDF.

    En esta tesis doctoral se describe la sintaxis de la extensión para la federación de consultas SPARQL además de formalizar su semántica. También hemos analizado los problemas asociados a la distribución de datos en bases de datos relacionales y adaptadas algunas de las soluciones existentes en ese contexto a nuestro problema. También describimos cómo accedemos a fuentes de datos en RDF y cómo hemos implementado un sistema de evaluación de consultas para la extensión de federación de consultas de SPARQL, describiendo algunas optimizaciones estáticas que fueron identificadas durante el análisis formal del lenguaje. Finalmente, hemos llevado a cabo una serie de experimentos que prueban cómo estas optimizaciones disminuyen el tiempo de evaluación de las consultas de forma significativa.


Fundación Dialnet

Mi Documat