Ir al contenido

Documat


Resumen de Semantic linkage of the invisible geospatial web

Francisco Javier López Pellicer Árbol académico

  • Antecedentes: El acceso efectivo a la información geoespacial adquiere una importancia fundamental en una economía basada en el conocimiento. Es esencial para muchas actividades tener acceso a los recursos geoespaciales a través de la Web. Desde la respuesta a un desastre a la decisión de desarrollar un nuevo negocio, el acceso a información geoespacial actualizada ofrecida a través de la Web Geoespacial puede ser la diferencia entre el éxito y el fracaso. Se define la Web Geoespacial como la colección de servicios Web, datos geoespaciales y metadatos que permiten el uso de datos geoespaciales en una amplia gama de aplicaciones de dominio. Esta tesis trata tres problemas relacionados con la Web Geoespacial. En primer lugar, los servicios estándar de la Web Geoespacial forman parte de la Web invisible. La literatura utiliza el término invisible para identificar la parte de la Web ignorada por los motores de búsqueda (invisible Web). Los usuarios comunes pueden estar al tanto del contenido de la Web invisible sólo por casualidad. A continuación, esta tesis clasifica el contenido de la Web Geoespacial accesible a través de servicios estándar como parte de la Web profunda (deep Web). El término profunda destaca que un contenido invisible tiene suficiente valor en si mismo para ser tratado como si estuviera en la superficie de la Web, en otras palabras, merece ser indexado por un motor de búsqueda. Los contenidos de la Web Geoespacial son parte de la Web profunda por su propia naturaleza. Es decir, los contenidos de la Web Geoespacial se ocultan detrás de servicios Web. Por último, los servicios estándar y contenidos de la Web Geoespacial están socialmente desconectados del resto de la Web. Los servicios públicos de la Web Geoespacial no están concebidos para servir a su funcionalidad a los consumidores de servicios y, al mismo tiempo, como herramienta social para la comunicación entre los agentes relacionados con los servicios.

    Actualmente, la vinculación de los servicios Web con la iniciativa de Datos abiertos enlazados (Linked Open Data), una de las materializaciones de la Web Semántica, parece prometer dicha posibilidad.

    Objetivo: Los problemas derivados de la invisibilidad de los servicios Web Geoespaciales podría mitigarse si es posible realizar un rastreo sistemático y enfocado de la Web en busca de dichos servicios en combinación con la publicación como Datos enlazados (Linked Data) de las descripciones y los contenidos de los servicios descubiertos. Esta tesis analiza la viabilidad de una solución basada en el desarrollo de una araña Web (Web crawler) enfocada a los servicios Web geoespaciales, y el acceso a la información sobre los servicios descubiertos como descripciones procesables por máquinas. Además, la solución analizada deberá permitir el acceso a contenido geoespacial remoto en el mismo formato. Este enfoque requiere el desarrollo de dos ontologías de dominio. La primera ontología describe la arquitectura abstracta de los serviciosWeb geoespaciales. La segunda ontología describe el contenido geoespacial.

    Ámbito. El rastreo se restringe a los servicios Web compatibles con las especificaciones de Open Geospatial Consortium (OGC). OGC lidera el desarrollo de especificaciones abiertas y estandarizadas interfaz de servicios Web para acceder a la información geoespacial desde 1994. Más de 400 compañías, agencias gubernamentales y universidades son miembros de OGC, y participan en los procesos de consenso para desarrollar a disposición del público las normas de interfaz de servicios Web para el acceso a los datos geoespaciales. Muchas especificaciones OGC que definen la interfaces de servicios Web se han convertido en estándares ISO (International Organization for the Standardization). Adicionalmente, el rastreo se limita a las especificaciones OGC de servicios Web relacionadas con la Directiva Europea INSPIRE. La Directiva INSPIRE es el marco más grande y más reciente de tamaño continental que establece normas compartidas entre los países europeos para el acceso a la información geográfica digital. Los servicios Web de OGC han sido señalados como una de las posibles implementaciones de los servicios de INSPIRE. Esta restricción garantiza que las contribuciones de esta tesis pueden beneficiar a investigadores y desarrolladores interesados en la aplicación de la Directiva INSPIRE (2010-2019). La conceptualización de la arquitectura de servicios Web de OGC debe ser reutilizable, y debe evitar una fuerte dependencia de la terminología de OGC. La arquitectura de servicios Web de OGC está basada en la familia de normas RM-ODP (Reference Model of Open Distributed Processing, ISO / IEC 10746-2 Foundations, ISO / IEC 10746-3 Arquitectura, ISO 15414 Enterprise language). RM-ODP es un modelo de referencia que proporciona un marco para la normalización de los sistemas abiertos de procesamiento distribuido. La terminología, los conceptos y las relaciones utilizadas para la conceptualización de esta tesis se derivan principalmente de la RM-ODP. Estos conceptos se aplican a conceptualizar el conocimiento del dominio que se encuentran en la especificación abstracta de OGC para los servicios Web y en la recopilación de normas específicas de OGC para interfaces de servicios Web. Cuando sea necesario, el conocimiento se formalizará mediante Lógica Descriptiva, una familia de formalismos de representación del conocimiento. Lógica Descriptiva está equipada con una semántica formal, basada en la lógica, que proporciona los procedimientos de inferencia para derivar conocimiento implícito del conocimiento que está explícitamente representada. El uso de Lógica Descriptiva se ve obstaculizado por la complejidad computacional de algunos de sus algoritmos de inferencia. Sin embargo, se reconoce que sistemas relativamente expresivos de tamaño real con problemas de razonamiento exponenciales en tiempo pueden ser procesados en un tiempo razonable. En esta tesis se formalizará el conocimiento tomando como límite la Lógica Descriptiva SROIQ(D). Esta Lógica Descriptiva tiene propiedades interesantes de cómputo. Razonadores populares, como Pellet y HermiT, soportan SROIQ(D). Además, el lenguaje de ontologías OWL 2 (Web Ontology Language 2) es compatible con algunas restricciones con SROIQ(D). Solo dos tipos de accesos a contenidos Geoespaciales se consideran en esta tesis: el acceso a los metadatos geoespaciales almacenados en OGC CSW y el acceso a los datos geoespaciales almacenados en OGC WFS. Por otra parte, el acceso a los metadatos geoespaciales almacenados en las instancias de servicio CSW se limita a los metadatos de los registros cuyo esquema de metadatos tiene una correspondencia conocida por el modelo abstracto de Dublin Core Metadata Initiative. El acceso a los datos geoespaciales se limita a los casos de servicios WFS que devuelvan fenómenos, es decir, representaciones de lugares, que se puedan corresponder con una extensión del meta modelo GKB, que fue desarrollado en el proyecto GREASE.

    Método: La aproximación metodología de esta tesis tiene dos aspectos: uno relacionado con la ingeniería de software y otro relacionados con la ingeniería del conocimiento. La metodología en la parte relacionada con la ingeniería de software es un desarrollo clásico incremental de la solución. La metodología en la parte de relacionada con la ingeniería del conocimiento se basa en Methontology.

    Importancia social, experiencia previa, trabajo futuro. El desarrollo de una Web Geoespacial pública, abierta e interoperable es consecuencia de las iniciativas para el desarrollo de Infraestructuras de Datos Espaciales (IDEs). Por ejemplo, la iniciativa europea INSPIRE (materializado en 2007 como Directiva Europea) tiene por objeto crear una IDE europea. Una de las líneas de investigación del grupo de investigación IAAA se centra en aspectos relacionados con las las IDEs como la descripción de los datos geoespaciales y los servicios, el descubrimiento de estos recursos a través de catálogos estándar, y los aspectos conceptuales y arquitectónicos relacionados con datos geoespaciales y servicios. Algunos resultados de la investigación de la línea de investigación de IDEs, donde ha participado el autor son la exploración de nuevas alternativas para el descubrimiento de servicios geoespaciales, y el estudio de nuevas formas de dar acceso a los datos geoespaciales y los metadatos. Este trabajo ha consistido en la caracterización de modelos de contenido, el desarrollo de conjuntos de datos geoespaciales, y la colaboración en la formalización y la producción de grandes geo-ontologías. Además, el autor ha participado en la elaboración de normas para el contenido geoespacial, y servicios geoespaciales. Esta tesis es resultado de la investigación citada. Las líneas de trabajo futuro están orientadas a mejorar las contribuciones relacionadas con en el descubrimiento de serviciosWeb geoespaciales, la formalización de los modelos y el acceso a los datos geoespaciales.


Fundación Dialnet

Mi Documat