TRAVaSI

Acronimo: 
TRAVaSI
Titolo: 
Trattamento Automatico di Varietà Storiche di Italiano
Tipo di Progetto: 
Regionale
Ente Finanziatore: 
Regione Toscana (POR FSE 2014-2020 - Asse A - Priorità A.2 – Obiettivo A.2.1 – Azione A.2.1.7)
Contratto: 
CUP B15J19001040004
Data di Inizio: 
01/06/2020
Data di Fine: 
31/05/2022
Status: 
In Corso
Ruolo ILC: 
Coordinatore
Responsabile Scientifico del Progetto: 

Il progetto TrAVaSI si propone di rendere fruibili da una vasta e variegata utenza i contenuti di un’istituzione culturale come l’Accademia della Crusca offrendo modalità di accesso e navigazione avanzate dotate di “intelligenza linguistica”.

In particolare, le attività del progetto si articolano in due macro-aree principali.

  1. Costruzione di lessici computazionali e corpora arricchiti con annotazione linguistica (primariamente annotazione morfo-sintattica e lemmatizzazione) per varietà storiche della lingua italiana
    Per quanto riguarda questa macro-area, il progetto intende affrontare il collo di bottiglia rappresentato dall’assenza di risorse adeguate (lessici e corpora annotati) per la specializzazione di strumenti di trattamento automatico della lingua a varietà storiche di italiano. Le risorse sviluppate verranno utilizzate per la specializzazione e/o lo sviluppo di componenti software per il trattamento automatico di varietà storiche di italiano, grazie alle quali sarà possibile mettere a punto modalità avanzate di accesso ai contenuti culturali, fruibili anche da un vasto pubblico.

  2. Estrazione e strutturazione della conoscenza contenuta in dizionari storici digitali
    In particolare, le attività di questa macro-linea riguarderanno la definizione di una strategia incrementale per la strutturazione dei contenuti di dizionari digitalizzati e la sua applicazione ad opere monumentali della lessicografia italiana quali i dizionari storici della lingua italiana messi a disposizione sul sito Web dell’Accademia della Crusca. La strategia di strutturazione dei contenuti è sviluppata in relazione al “Grande dizionario della lingua italiana” fondato da Salvatore Battaglia (UTET).

Le due macro-aree di attività presentano importanti sinergie che verranno esplorate nel corso del progetto. Se da un lato la conoscenza estratta dai dizionari storici potrà fornire un prezioso input per la costruzione dei lessici computazionali da utilizzarsi per l’annotazione dei testi, dall’altro gli strumenti di annotazione linguistica potranno fornire un supporto nel processo di estrazione e strutturazione della conoscenza dai dizionari storici selezionati.

I risultati raggiunti nelle due macro-aree di attività creeranno i presupposti per l’erogazione di servizi innovativi ed avanzati di valorizzazione di collezioni testuali che testimoniano varietà storiche della lingua italiana, con importanti ricadute per la comunità di studiosi delle Scienze Umane, in ambito educativo, così come per le istituzioni culturali che si trovano a doversi confrontare con testi storici digitali.


TrAVaSI Banner