- La Agencia Vasca de la Innovación colabora con el proyecto Euskorpus que promueve Euskorpora, asociación sin ánimo de lucro promovida por el Gobierno Vasco, una iniciativa que busca garantizar la presencia del euskera en entornos digitales e inteligencia artificial
INNOBASQUE, 20 de noviembre de 2025. La Agencia Vasca de la Innovación, Innobasque acaba de firmar un convenio de colaboración con Euskorpora, la asociación sin ánimo de lucro promovida por el Gobierno Vasco para desarrollar el corpus digital del euskera y garantizar su presencia en los entornos digitales, especialmente en el ámbito de la inteligencia artificial. Juntas, ambas entidades explorarán nuevas oportunidades en proyectos tecnológicos, investigación y servicios digitales donde el euskera tenga un papel activo y relevante.
Innobasque y Euskorpora se comprometen así a colaborar en el diseño, promoción y materialización de proyectos orientados a fortalecer la presencia digital del euskera en entornos de inteligencia artificial, así como a contribuir a la consecución de recursos económicos para la puesta en marcha de proyectos de cooperación.
La colaboración entre ambas entidades se fortalecerá además con la incorporación de Euskorpora a Innobasque, lo que permitirá a esta asociación acercar su conocimiento sobre el euskera digital a las más de 900 entidades que ya integran Innobasque y trabajan desde ella por fomentar la innovación en Euskadi, ahora también en el ámbito lingüístico.
Proyecto Euskorpus
El proyecto Euskorpus se constituye como la herramienta fundamental para la generación de ese corpus digital en euskera. Euskorpus se encuentra en marcha y cuenta con una dotación presupuestaria inicial de 5,55 millones de euros, a través del Departamento de Industria, Transición Energética y Sostenibilidad, con 2 millones consignados para 2025 y otros 3 millones para 2026. Además, los Departamentos de Cultura y Política Lingüística y de Ciencia, Universidades e Innovación también participan en el proyecto, con una aportación de 550.000 euros iniciales.
La creación del corpus digital del euskera se ejecutará en tres principales fases: la primera fase será la de planificación y definición, y en ella se constituirá la oficina técnica que determinará la tipología del corpus y los modelos a desarrollar, y se definirán los sectores, aplicaciones y servicios estratégicos que se puedan beneficiar del mismo.
En la segunda fase, se pretende impulsar la compilación de corpus lingüísticos en euskera, impulsar el desarrollo de modelos base de códigos abiertos, e impulsar las infraestructuras para almacenamiento seguro, ensayos y validación.
Finalmente, en la tercera fase, se impulsará la transferencia y explotación de los corpus lingüísticos que se vayan compilando y de los modelos base de código abierto que se vayan desarrollando a las empresas, a la sociedad y a otras plataformas de datos europeas.




