- Horrela, Berrikuntzaren Euskal Agentzia lankidetzan ari da Eusko Jaurlaritzak sustatutako irabazi asmorik gabeko elkarteak sustatzen duen Euskorpus proiektuarekin, ingurune digitaletan eta adimen artifizialean euskararen presentzia bermatzea helburu duen ekimenarekin
INNOBASQUE, 2025eko azaroaren 20a. Berrikuntzaren Euskal Agentziak, Innobasquek, lankidetza hitzarmen bat sinatu berri du Euskorporarekin, Eusko Jaurlaritzak sustatutako irabazi asmorik gabeko elkartearekin, euskararen corpus digitala garatzeko eta ingurune digitaletan presentzia bermatzeko, bereziki adimen artifizialaren esparruan. Elkarrekin, bi erakundeek aukera berriak aztertuko dituzte euskarak zeregin aktibo eta garrantzitsua duen proiektu teknologiko, ikerketa eta zerbitzu digitaletan.
Horrela, Innobasquek eta Euskorporak konpromisoa hartzen dute adimen artifizialeko inguruneetan euskararen presentzia digitala indartzera bideratutako proiektuak diseinatzen, sustatzen eta gauzatzen laguntzeko, bai eta lankidetza proiektuak abian jartzeko baliabide ekonomikoak lortzen laguntzeko ere.
Gainera, bi erakundeen arteko lankidetza indartu egingo da Euskorpora Innobasquen sartuz, eta, horri esker, elkarte horrek euskara digitalari buruz duen ezagutza Innobasque osatzen duten 900 erakunde baino gehiagori hurbildu ahal izango die, eta Innobasquek Euskadin berrikuntza sustatzeko lan egiten du, orain hizkuntzaren esparruan ere.
Euskorpus proiektua
Euskorpus proiektua funtsezko tresna da corpus digital hori euskaraz sortzeko. Euskorpus martxan dago, eta 5,55 milioi euroko hasierako aurrekontu zuzkidura du, Industria, Trantsizio Energetiko eta Jasangarritasun Sailaren bidez, 2025erako 2 milioi esleituta, eta beste 3 milioi 2026rako. Gainera, Kultura eta Hizkuntza Politika Sailak eta Zientzia, Unibertsitate eta Berrikuntza Sailak ere parte hartzen dute proiektuan, hasierako 550.000 euroko ekarpenarekin.
Euskararen corpus digitala hiru fase nagusitan sortuko da: lehenengo fasea plangintza eta definizioa izango da, eta bertan corpusaren tipologia eta garatu beharreko ereduak zehaztuko dituen bulego teknikoa eratuko da, eta horretaz balia daitezkeen sektore, aplikazio eta zerbitzu estrategikoak definituko dira.
Bigarren fasean, euskarazko corpus linguistikoaren konpilazioa bultzatu nahi da, kode irekien oinarrizko ereduen garapena bultzatu, eta biltegiratze segururako, saiakuntzetarako eta balidaziorako azpiegiturak bultzatu.
Azkenik, hirugarren fasean, konpilatzen diren corpus linguistikoak eta kode irekiko oinarrizko ereduak enpresei, gizarteari eta Europako beste datu-plataforma batzuei transferitzea eta ustiatzea bultzatuko da.




