
L’Alliance for Language Technologies European Digital Infrastructure Consortium (ALT-EDIC) è stato proposto nel dicembre 2023 come uno dei primi European Digital Infrastructure Consortium (EDIC). Il 7 febbraio 2024, la Commissione europea ha istituito ufficialmente ALT-EDIC con l’Implementing Decision (EU) 2024/458. Coordinato dalla Francia, ALT-EDIC è sostenuto da diversi Stati membri, tra cui l’Italia..
La missione di ALT-EDIC è quella di sviluppare un’infrastruttura comune europea nel campo delle tecnologie linguistiche, concentrandosi in particolare sui Large Language Models. Si propone di:
- migliorare la competitività europea;
- aumentare la disponibilità dei dati linguistici europei;
- sostenere la diversità linguistica e la ricchezza culturale dell’Europa.

L’European Language Data Space (LDS) è un’iniziativa dell’UE volta a creare una piattaforma centralizzata per la condivisione e la monetizzazione dei dati linguistici in settori quali l’editoria, la tecnologia linguistica e i media. Lanciato nel gennaio 2023, l’LDS si propone di:
- migliorare l’accessibilità dei dati;
- sostenere la conformità con i regolamenti dell’UE;
- promuovere l’innovazione nel settore dell’intelligenza artificiale e della tecnologia linguistica.
LDS enfatizza la sovranità dei dati, consentendo ai contributori di mantenere il controllo sui propri dati e promuovendo al contempo scambi di dati sicuri e conformi all’UE.
Il contributo di CNR-ILC
Le iniziative LDS eALT-EDIC sono strettamente collegate. LDS sta creando l’infrastruttura e il quadro di governance che consentiranno la condivisione e il riutilizzo dei dati linguistici necessari per sviluppare Large Language Models. ALT-EDIC garantirà la sostenibilità a lungo termine dell’LDS. Insieme, queste due iniziative contribuiranno a creare un unico mercato digitale per le tecnologie linguistiche in Europa.
Il governo italiano ha delegato il Cnr-Istituto di Linguistica Computazionale “Antonio Zampolli” (CNR-ILC), Fondazione Bruno Kessler (FBK) e CINECA a far parte di ALT-EDIC. In particolare, CNR-ILC fornisce personale per le politiche, il supporto tecnico e diversi set di dati italiani ospitati da CLARIN-IT e utilizzati per addestrare modelli come GePpeTto.
CNR-ILC partecipa all’iniziativa LDS organizzando un workshop nazionale che riunirà esperti dell’industria, della pubblica amministrazione e della ricerca per discutere dell’importanza dei dati linguistici per lo sviluppo di tecnologie linguistiche affidabili e sicure e di strumenti basati sull’intelligenza artificiale per la lingua italiana.