Aitzol Astigarraga Pagoaga, David Lindemann, Marije Bidaguren
As the number of scientific articles published in Basque is constantly growing, important questions about the academicuse of Basque arise: What are the reference works in each area and the use of Basque in the academic world,among others.The ZITERAUZI project aims to create an infrastructure for addressing these and similar questions, extracting citationrelations from and to scientific articles published in Basque, representing them as graphs, and allowing bibliometricstudies.The project we present is located in the field of digital humanities. Starting point is the Basque scientific productiondatabase Inguma. We propose to enrich the metadata of scientific publications currently part of Inguma byrepresenting extracted citation relations.In fact, traditional methods of article searches, as the number of research publications increases, are losing efficiency.Semantic web technologies (Linked Open Data), have given way to new opportunities for recording, exhibiting,and querying publication collections. This is where our contribution is aiming at.This article follows two specific goals: on the one hand, to highlight the importance of open citation graphs forbibliometric studies and research evaluation; and, on the other hand, to discuss a tool chain for citation extractionfrom Basque scientific articles and their representations in a directed graph, that is, ZITERAUZI.The graph that we intend to build serves as infrastructure for different use cases, which together allow progress inthe study of the scientific production in Basque.In collaboration with the Digital Humanities Centre in Errenteria (Astigarraga, Iñurrieta et al., 2021), in 2024,we will carry out a pilot study on articles from the IkerGazte conference series in the Inguma database, enabling amore detailed evaluation of Ziterauzi. The tool chain and manual work flow will then be ready to process furthercollections. Regarding manual efforts, process metadata obtained in this first study will allow us to make predictionsof the workload necessary to manually validate the citation relations extracted from the bibliography sectionof a publication.In this article, we enquire into theoretical fundamentals, we delve into techniques for effectively representingstructured metadata such as citation relations in a machine-readable format, and we discuss relevant tools availabletoday.
Euskaraz argitaratutako artikulu zientifikoen kopurua gora egin ahala, euskararen erabilera akademikoan garrantzinabarmena duten galderak sortzen zaizkigu: zeintzuk dira zientzialarien erreferentziazko lanak arlo bakoitzean etazer pisu eta erabilera dauka euskarak mundu akademikoan, besteak beste.Galdera horiei eta antzekoei erantzuteko azpiegitura sortu nahi du ZITERAUZI egitasmoak, euskaraz argitaratzendiren artikuluen zitazioak erauziz, grafo batean jasoz eta azterketa bibliometrikoak ahalbidetuz.Aurkezten dugun proiektu hau Humanitate Digitalen esparruan kokatzen da. Euskarazko ekoizpen zientifikoa biltzenduen Inguma datu-basea abiapuntu gisa hartuta, argitalpen zientifikoen metadatuak (gaur egun Inguma-n jasotadauden argitalpen-metadatuak) testu osoak prozesatuz aberastea proposatzen dugu, zitazio-erlazioak erauzizeta erakutsiz.Izan ere, ikerketa-kopurua gora egin ahala artikuluak bilatzeko metodo tradizionalak eraginkortasuna galtzen aridira. Lotutako Datu Irekiak (LOD, Linked Open Data) deritzen web semantikoaren teknologiek argitalpen bildumakjaso, antolatu eta aztertzeko aukera berriei bide eman diete eta hor ere kokatzen da gure ekarpena.Aurkezten dugun lan honek bi helburu zehatz dauzka: batetik, ikerkuntzaren testuinguruan, zitazio-erlazioengrafo libreak daukan garrantzia nabarmentzea, bai azterketa bibliometrikoetarako, bai eta ikerkuntzaren berarenebaluaziorako ere; eta, bestetik, euskaraz argitaratzen diren artikuluetako aipuak erauzi eta sare zuzendu bateanbiltzeko tresna-katea erakustea: ZITERAUZI.Eraiki nahi dugun zitazio-grafo horrek hainbat erabilera izan ditzake eta euskarazko ekoizpen akademiko-zientifikoarenazterketan, ebaluaketan eta bilaketan aurrerapausoak ekarriko ditu.Errenteriako Humanitate Digitalen gunearekin lankidetzan (Astigarraga, Iñurrieta et al., 2021), 2024. urtean Ingumadatu-basean jasotako IKERGAZTE kongresuko artikuluen erauzketa burutuko dugu eta horrek balioko diguZITERAUZIren ebaluazio zehatzagoa egiteko. Tresna-katea eta eskuzko lan-fluxua prest geratuko dira bildumagehiago prozesatzeko. Eskuzko lanari dagokionez, proiektu honetan lortutako prozesu metadatuek lan-kargarenaurreikuspena ahalbidetuko dute, hau da, argitalpen baten bibliografiatik lortutako zitazio-erlazioak eskuz balidatzekobatez besteko denborak.Artikulu honetan gaia behar bezala kokatzeko oinarri teorikoak azalduko ditugu, zitazio-erlazioak bezalako metadatuakademikoei formatu egituratua eta konputagailuetarako irakurgarria nola eman, eta hori egiteko egun eskuradauden tresnak erakutsiz.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados