Ir al contenido

Documat


Resumen de Enriquecimiento automático de portales culturales mediante modelosde organización del conocimiento

Dayany Díaz Corona, Javier Lacasta Miguel Árbol académico, Javier Nogueras Iso Árbol académico

  • español

    Durante las últimas décadas se han ido creando nu-merosos portales web para diseminar el patrimonio cultural. La mayoría de estos portales se crearon en tiempos de la web sintáctica generando páginas HTML con texto plano indexable por buscadores, pero sin metadatos añadidos y anotaciones de conceptos per-tenecientes a modelos de organización del conoci-miento que facilitarían la labor de buscadores temáti-cos especializados. Este artículo propone un método para recomendar los modelos de organización del co-nocimiento que mejor se ajusten a los contenidos de un portal web, y utilizar esos modelos para anotar se-mánticamente los contenidos. Para verificar la viabili-dad del método propuesto se ha aplicado en el enri-quecimiento deun portal creado a mediados de los años 90 yque aloja un catálogo virtual de las obras del pintor Goya. Gracias al método propuesto, se ha reco-mendado el modelo de organización del conocimiento denominado Lista de Encabezamientos de Materias para las Bibliotecas Públicas por su cercanía con el contenido del portal. Además, se hanconseguido ano-tar semánticamente dos tercios de las páginas en cas-tellano del portal con conceptos de este modelo. Aun-que la exactitud de los emparejamientos entre las en-tidades detectadasen el textoy los conceptos del mo-delo no esperfecta, la anotación realizada constituye una buena base para que los administradores del por-tal puedan refinar posteriormente esta anotación.

  • English

    During the last decades, numerous web portals have been launched to disseminate the cultural heritage. Most of these portals were developed with technolo-gies from the syntactic web era, i.e. containing HTML pages with plain text that can be indexed by search en-gines, but without additional metadata and annotations of concepts belonging to knowledge organization sys-tems that would facilitate the task of thematic special-ized search engines. This paper proposes a method for recommending the knowledge organization systems that are better adjusted for the contents of a web portal and the use of these systems for the semantic annota-tion of the contents. To check the feasibility of the pro-posed method, we have applied it to the enrichment of a web portal created inthe nineties that hosts a virtual catalogue of the works performed by the painter Goya. Thanks to the proposed method, we have been able to recommend knowledge organization system titled List of Subject Headings for Public Libraries because of its closeness with the portal content. In addition, two thirds of the web pages in Spanish were annotated with con-cepts belonging to this model. Although the accuracy of the mapping between the recognized entities in the text and the concepts of the model is not perfect, it con-stitutes a good base to allow web portal administrators to refine later this annotation.


Fundación Dialnet

Mi Documat