Ir al contenido

Documat


Resumen de Linguistic linked data for lexicography

Julia Bosque Gil

  • Con el incesante aumento de los recursos léxicos que surgen de numerosos proyectos en lingüística, lexicografía, y tecnologías del lenguaje, hoy en día los datos léxicos se encuentran en distintos formatos, dispersos y aislados unos de otros en la Web. Los Datos Enlazados Lingüísticos (por sus siglas en inglés, LLD) es una línea de investigación desarrollada por expertos en el campo de la Web Semántica que responde a la necesidad de estandarización en la representación de datos lingüísticos y que se basa en el paradigma de los Datos Enlazados (LD). Pese a que la línea de LLD se centra en la representación, la publicación, y la difusión de los recursos lingüísticos, no existe hasta la fecha un estudio amplio ni una valoración del impacto que tendría su aplicación a la lexicografía como disciplina: cuáles son los requisitos que cumplir en la representación de recursos lexicográficos como LLD, qué procesos habría que llevar a cabo, cuáles serían las ventajas prácticas y teóricas de este tipo de representación, los desafíos a los que daría lugar, ni los posibles problemas a los que habría que hacer frente. Asimismo, como piezas necesarias en ese estudio, destaca también la falta de guías para representar un amplio abanico de recursos lexicográficos en este nuevo paradigma. En esta tesis doctoral se investiga la aplicación de los LLD a la lexicografía desde la perspectiva del lexicógrafo, el usuario de recursos lexicográficos, o el lingüista interesado en la semántica léxica que necesita acceder a contenido lexicográfico para su trabajo. Esta tesis identifica y resuelve una serie de problemas de modelado a la hora de representar contenido lexicográfico en el formato RDF (Resource Description Framework). Mediante la definición de perfiles de aplicación y de extensiones para el estándar de facto más utilizado en LLD, este trabajo presenta una serie de recursos lexicográficos en formato RDF que sirven para analizar y demostrar las ventajas de este paradigma para codificar información lexicográfica, tanto como formato final de un recurso tras una conversión, como como formato nativo para la creación de nuevas obras lexicográficas.


Fundación Dialnet

Mi Documat