Ir al contenido

Documat


Resumen de Diseño de un repositorio RDF basado en tecnologías NOSQL

Ana Isabel Torre Bastida Árbol académico, Marta González Rodríguez, Arantza Illarramendi Echave Árbol académico, Jesús Bermúdez de Andrés Árbol académico

  • Actualmente existen en la Web una cantidad ingente de datos en formato RDF, que pueden ser accedidos mediante el protocolo HTTP. Estos datos se encuentran publicados y vinculados los unos con los otros bajo el paradigma LinkedData. Un almacenamiento eficiente, requiere tener en cuenta, entre otros, los siguientes aspectos; distribución, escalabilidad y orientación a la consulta.

    Nuestra propuesta para lograrlo consiste en almacenarlos en bases de datos NOSQL, debido a sus propiedades de escalabilidad y rendimiento y a su naturaleza distribuida. En concreto en las de tipo familia de columnas, como Cassandra DB, ya que en su modelo de datos se puede mapear de forma simple el concepto de tripleta RDF (sujeto-predicado-objeto). En lo relativo a la consulta de los datos, planteamos en un primer momento la utilización del lenguaje estándar de consulta en RDF SPARQL, mediante un módulo intermedio que permita realizar la traducción desde este lenguaje a la consulta en bases de datos NOSQL, así como un mecanismo de indexación distribuido basado en MapReduce, otra tecnología proveniente del mundo NOSQL, que nos permitirá aumentar el rendimiento en el procesamiento de consultas. En resumen, esperamos obtener como resultado un repositorio RDF que mejore los tiempos de consulta y razonamiento de los datos y que ofrezca facilidades para llevar a cabo la escalabilidad y distribución de estos.


Fundación Dialnet

Mi Documat