Infrastrutture digitali

L’Alliance for Language Technologies European Digital Infrastructure Consortium (ALT-EDIC) è stato proposto nel dicembre 2023 come uno dei primi European Digital Infrastructure Consortium (EDIC). Il 7 febbraio 2024, la Commissione europea ha istituito ufficialmente ALT-EDIC con l’Implementing Decision (EU) 2024/458. Coordinato dalla Francia, ALT-EDIC è sostenuto da diversi Stati membri, tra cui l’Italia..

La missione di ALT-EDIC è quella di sviluppare un’infrastruttura comune europea nel campo delle tecnologie linguistiche, concentrandosi in particolare sui Large Language Models. Si propone di:

  • migliorare la competitività europea;
  • aumentare la disponibilità dei dati linguistici europei;
  • sostenere la diversità linguistica e la ricchezza culturale dell’Europa.

L’European Language Data Space (LDS) è un’iniziativa dell’UE volta a creare una piattaforma centralizzata per la condivisione e la monetizzazione dei dati linguistici in settori quali l’editoria, la tecnologia linguistica e i media. Lanciato nel gennaio 2023, l’LDS si propone di:

  • migliorare l’accessibilità dei dati;
  • sostenere la conformità con i regolamenti dell’UE;
  • promuovere l’innovazione nel settore dell’intelligenza artificiale e della tecnologia linguistica.

LDS enfatizza la sovranità dei dati, consentendo ai contributori di mantenere il controllo sui propri dati e promuovendo al contempo scambi di dati sicuri e conformi all’UE.

Il contributo di CNR-ILC

Le iniziative LDS eALT-EDIC sono strettamente collegate. LDS sta creando l’infrastruttura e il quadro di governance che consentiranno la condivisione e il riutilizzo dei dati linguistici necessari per sviluppare Large Language Models. ALT-EDIC garantirà la sostenibilità a lungo termine dell’LDS. Insieme, queste due iniziative contribuiranno a creare un unico mercato digitale per le tecnologie linguistiche in Europa.

Il governo italiano ha delegato il Cnr-Istituto di Linguistica Computazionale “Antonio Zampolli” (CNR-ILC)Fondazione Bruno Kessler (FBK) e CINECA a far parte di ALT-EDIC. In particolare, CNR-ILC fornisce personale per le politiche, il supporto tecnico e diversi set di dati italiani ospitati da CLARIN-IT e utilizzati per addestrare modelli come GePpeTto.

CNR-ILC partecipa all’iniziativa LDS organizzando un workshop nazionale che riunirà esperti dell’industria, della pubblica amministrazione e della ricerca per discutere dell’importanza dei dati linguistici per lo sviluppo di tecnologie linguistiche affidabili e sicure e di strumenti basati sull’intelligenza artificiale per la lingua italiana.