SAVAS

Acronimo: 
SAVAS
Titolo: 
Sharing AudioVisual language resources for Automatic Subtitling
Tipo di Progetto: 
Europeo
Ente Finanziatore: 
European Commission
Programma di Finanziamento: 
7th Framework Programme
Contratto: 
FP7-ICT-2011-SME-DCL-296371
Data di Inizio: 
01/05/2012
Data di Fine: 
30/04/2014
Status: 
Terminato
Responsabile Scientifico del Progetto: 
Carlo Aliprandi (SyNTHEMA S.r.l.)
Responsabile Scientifico dell'Unità di Ricerca dell'ILC: 
Staff: 

Il progetto SAVAS ha raccolto le risorse parlate e testuali di sei lingue comunitarie, sviluppando Large Vocabulary Continuous Speech Recognizers (LVCSR): riconoscitori continui del parlato di un vasto vocabolario a dominio specifico per risolvere le esigenze di sottotitolazione automatizzata nell'industria dei media.

Più specificamente, gli obiettivi principali del progetto erano i seguenti:

  • rendere più efficace l'aquisizione e l'annotazione di risorse linguistiche audiovisive prodotte dai presentatori televisivi e dalle aziende che si occupano di sottotitolazione per lo sviluppo di sistemi LVCSR finalizzati alla sottotitolazione automatizzata;
  • utilizzare una piattaforma per condividere le risorse linguistiche audiovisive di lingua fra industria dei media e sviluppatori di LVCSR attraverso i metodi legali e commerciali più adatti di scambio dei dati;
  • mostrare gli effetti sulla tecnologia LVCSR delle attuali risorse linguistiche audiovisive utilizzate per la sottotitolazione automatizzata.

Per realizzare questi obiettivi, SAVAS:

  • ha raccolto risorse parlate e testuali nelle lingue affrontate dai presentatori televisivi e dalle aziende che fornivano i dati all'interno del consorzio;
  • ha trascritto e annotato i corpora raccolti in una forma adatta ad "addestrare" i modelli linguistici ed acustici dei sistemi LVCSR, usando una combinazione di metodi automatici e collaborativi;
  • ha costruito un archivio META-SHARE locale contenente le risorse linguistiche  SAVAS raccolte ed annotate, per permettere una loro riutilizzazione;
  • ha adattato e istruito i sistemi di dettatura e di trascrizione LVCSR con le risorse linguistiche di SAVAS;
  • ha integrato e valutato i sistemi sviluppati in varie situazioni di applicazione della sottotitolazione automatizzata per mostrare gli effetti dei dati audiovisivi condivisi sulla sottotitolazione automatizzata.