Ana Isabel Torre Bastida , Marta González Rodríguez
, Arantza Illarramendi Echave
, Jesús Bermúdez de Andrés
Actualmente existen en la Web una cantidad ingente de datos en formato RDF, que pueden ser accedidos mediante el protocolo HTTP. Estos datos se encuentran publicados y vinculados los unos con los otros bajo el paradigma LinkedData. Un almacenamiento eficiente, requiere tener en cuenta, entre otros, los siguientes aspectos; distribución, escalabilidad y orientación a la consulta.
Nuestra propuesta para lograrlo consiste en almacenarlos en bases de datos NOSQL, debido a sus propiedades de escalabilidad y rendimiento y a su naturaleza distribuida. En concreto en las de tipo familia de columnas, como Cassandra DB, ya que en su modelo de datos se puede mapear de forma simple el concepto de tripleta RDF (sujeto-predicado-objeto). En lo relativo a la consulta de los datos, planteamos en un primer momento la utilización del lenguaje estándar de consulta en RDF SPARQL, mediante un módulo intermedio que permita realizar la traducción desde este lenguaje a la consulta en bases de datos NOSQL, así como un mecanismo de indexación distribuido basado en MapReduce, otra tecnología proveniente del mundo NOSQL, que nos permitirá aumentar el rendimiento en el procesamiento de consultas. En resumen, esperamos obtener como resultado un repositorio RDF que mejore los tiempos de consulta y razonamiento de los datos y que ofrezca facilidades para llevar a cabo la escalabilidad y distribución de estos.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados