Ir al contenido

Documat


Integración de anotaciones espaciales automáticas de diferentes fuentes mediante tecnologías semánticas

  • Javier Nogueras Iso [1] ; Verónica Lázaro ; Ludovic Moncla [2]
    1. [1] Universidad de Zaragoza

      Universidad de Zaragoza

      Zaragoza, España

    2. [2] Université Pau Cedex
  • Localización: Scire: Representación y organización del conocimiento, ISSN 1135-3716, Vol. 22, Nº 2, 2016, págs. 29-36
  • Idioma: español
  • DOI: 10.54886/scire.v22i2.4361
  • Títulos paralelos:
    • Integration of automatic spatial annotations from different sources by means of semantic technologie
  • Enlaces
  • Resumen
    • español

      La extracción de información es una de las tareas principales de la minería de textos que resulta de gran utilidad para todo tipo de aplicaciones que exploten la información geográfica ya que hay gran cantidad de información geográfica que no se recopila directamente en formatos reconocibles por Sistemas de Información Geográfica, sino directamente como texto plano. Actualmente existen diversas soluciones informáticas para el procesamiento de textos y la anotación de entidades espaciales. Sin embargo, el problema que tienen estas herramientas es que producen como resultado de este procesamiento un texto anotado con lenguajes de marcado propio, que dificulta su integración en otros sistemas. El objetivo de este trabajo es proponer la conversión de la salida de estas herramientas a un lenguaje de anotación espacial común basado en tecnologías semánticas que facilite su integración e interoperabilidad. Como factor común delos lenguajes de marcado se propone una anotación de textos basada en RDFa y utilizando el vocabulario de la iniciativa internacional Schema.org. Para validar la utilidad de esta propuesta se ha creado la infraestructura necesaria para construir un repositorio semántico de documentos donde se integren y armonicen las anotaciones generadas por diversas herramientas de anotación existentes.

    • English

      Information extraction is one of the main tasks in text mining, which is essential for all types of applications exploiting geographic information because there is a big volume of geographic information not directly compiled in specific formats proposed by Geographic Information Systems, but just embedded in plain text sources. Currently, there are several software solutions for the processing of texts and the annotation of spatial named entities. However, the problem of these tools is that their output is based on heterogeneous annotation languages, which make it difficult their integration in other systems.The objective of this work is to propose the conversion of the output of these tools into a common spatial annotation language based on semantic technologiesto facilitate their integration and interoperability. As a common annotation language we propose the use of a text annotation based on RDFa and using the vocabulary proposed by the international initiative Schema.org. In order to validate this proposal, we have created the necessary infrastructure to build a semantic repository of documents, where the annotations generated by different annotation tools can be integrated and harmonized.

  • Referencias bibliográficas
    • Apache (2010). The Apache Software Foundation. Apache OpenNLP web site. https://opennlp.apache.org/ (201604-28)
    • Bootstrap (2016). Bootstrap web site. http://getbootstrap.com/ (2016-04-28)
    • Cyganiak, R., Wood, D., Lanthaler, M. (eds.) (2014). RDF 1.1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014. https://www.w3.org/TR/2014/RECrdf11-concepts-20140225/...
    • Doan, A., Halevy, A., Zachary, I. (2012). Principles of Data Integration (1st ed.). Morgan Kaufmann Publishers Inc., San Francisco, CA, USA....
    • Gobierno de Aragón (2016). Turismo de Aragón. Senderos de Aragón. Excursiones y rutas para GPS. http://senderos.turismodearagon.com (2016-04-28)
    • Google (2016). AngularJS API Docs. https://docs.angularjs.org/api (2016-04-28)
    • Harris, S., Seaborne, A. (eds.) (2013). SPARQL 1.1 Query Language. W3C Recommendation 21 March 2013. http://www.w3.org/TR/2013/REC-sparql11-query20130321/...
    • Herman, I., Adida, B., Sporny, M., Birbeck, M. (eds.) (2015). RDFa 1.1 Primer Third Edition. Rich Structured Data Markup for Web Documents....
    • Khalili, A., Auer, S. (2015). WYSIWYM–Integrated visualization, exploration and authoring of semantically enriched un-structured content....
    • Leidner, J. L. (2008). Toponym Resolution in Text: Annotation, Evaluation and Applications of Spatial Grounding of Place Names. Universal-Publishers
    • Leidner, J. L.; Lieberman, M. D. (2011). Detecting geographical references in the form of placenames and associated spatial natural language....
    • López-Pellicer, F. J.; Lacasta, J.; Florczyk, A.; Nogueras-Iso, J.; Zarazaga-Soria, F.J. (2012). An Ontology for the representation of Spatio-Temporal...
    • Maurel, D.; Friburger, N. (2004). Finite-state transducer cascades to extract named entities in texts. Theoretical Computer Science. 313:1,...
    • Moncla, L. (2015a). PERDIDO REST API Specifications. http://erig.univ-pau.fr/PERDIDO/api.jsp (2016-04-28)
    • Moncla, L. (2015b). Automatic reconstruction of itineraries from descriptive texts. PhD Dissertation, Université de Pau et des Pays de l’Adour...
    • Moncla, L.; Gaio, M.; Mustière, S. (2014). Automatic Itinerary Reconstruction from Texts. Proc. 8th International Conference, GIScience 2014,...
    • Pivotal Software (2016). Spring Framework. http://projects.spring.io/spring-framework/ (2016-04-28)
    • Santos, J.; Anastacio, I.; Martins, B (2014). Using machine learning methods for disambiguating place references in textual documents. //...
    • Sekine, S.; Ranchhod, E. (eds.) (2009). Named Entities: Recognition, Classification and Use. John Benjamins. ISBN 9789027289223.
    • SemEval (2015). International Workshop on Semantic Evaluation (SemEval-2015): Task 8-SpaceEval Test Data. http://alt.qcri.org/semeval2015/task8/index.php?id=dataand-tools...
    • Stolz, A. (2014). RDF Translator. http://rdf-translator.appspot.com/ (2016-04-28).
    • Thomson Reuters (2016). Open Calais web site. http://www.opencalais.com/ (2016-04-28).
    • University of Tours (2016) CasEN web site. http://tln.li.univtours.fr/Tln_CasEN.html (2016-04-28).
    • Visorando (2016). Visorando web site. http://www.visorando.com (2016-04-28).

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno