Xabier Artola Zubillaga , Nerea Ezeiza Ramos , Antton Gurrutxaga Hernaiz, Andoni Sagarna Izaguirre , Miriam Urkia
Euskaltzaindiak bere zereginen artean ditu hizkuntza lantzea eta aztertzea, eta erabilerari dagozkion arauak ematea. Bestalde, ez dago zalantzarik corpusak behar-beharrezkoak direla egun hizkuntza baten erabilera erreala monitorizatzeko. Lexikoaren Behatokia (LB) proiektua Euskaltzaindiaren ekimenez abiatu zen, 2007an, Hiztegi Batuko Lantaldeak egindako proposamen bati erantzunez. Proiektuaren emaitza da izen bera duen corpusa, zeina web bidez kontsultatu baitaiteke. Proiektua indarrean dago oraindik ere, eta, azken hamar urteotan, ia 60 milioi hitzeko testu-corpus bat eratu da. Corpusa automatikoki prozesatuta dago, eta linguistikoki etiketatuta, eta hizkuntza-corpusek ohikoa duten kontsulta-funtzionalitatea eskaintzen dio erabiltzaileari. Artikuluan, corpusa sortzeko arrazoiak aipatzen dira, eta proiektuaren helburu nagusiak eta corpusaren ezaugarriak zein diren azaltzen. Halaber, corpusa eratzeko lan-prozedura xehatzen da: testuen eskuratzea eta katalogazioa egiteko modua, corpuseratzearen nondik norakoak, eta zertan datzan prozesamendu linguistikoa. Bukatzeko, Euskaltzaindiak corpusa nola eta zertarako baliatzen duen, eta etorkizunerako asmoak zertan diren azaltzen da.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados