SAVAS

Sharing AudioVisual language resources for Automatic Subtitling

Tipo di progetto: European  |  Data inizio: 01/05/2012  |  Data di fine: 30/04/2014

Il progetto SAVAS ha raccolto le risorse parlate e testuali di sei lingue comunitarie, sviluppando Large Vocabulary Continuous Speech Recognizers (LVCSR): riconoscitori continui del parlato di un vasto vocabolario a dominio specifico per risolvere le esigenze di sottotitolazione automatizzata nell’industria dei media.

Più specificamente, gli obiettivi principali del progetto erano i seguenti:

  • rendere più efficace l’aquisizione e l’annotazione di risorse linguistiche audiovisive prodotte dai presentatori televisivi e dalle aziende che si occupano di sottotitolazione per lo sviluppo di sistemi LVCSR finalizzati alla sottotitolazione automatizzata;
  • utilizzare una piattaforma per condividere le risorse linguistiche audiovisive di lingua fra industria dei media e sviluppatori di LVCSR attraverso i metodi legali e commerciali più adatti di scambio dei dati;
  • mostrare gli effetti sulla tecnologia LVCSR delle attuali risorse linguistiche audiovisive utilizzate per la sottotitolazione automatizzata.

Per realizzare questi obiettivi, SAVAS:

  • ha raccolto risorse parlate e testuali nelle lingue affrontate dai presentatori televisivi e dalle aziende che fornivano i dati all’interno del consorzio;
  • ha trascritto e annotato i corpora raccolti in una forma adatta ad “addestrare” i modelli linguistici ed acustici dei sistemi LVCSR, usando una combinazione di metodi automatici e collaborativi;
  • ha costruito un archivio META-SHARE locale contenente le risorse linguistiche  SAVAS raccolte ed annotate, per permettere una loro riutilizzazione;
  • ha adattato e istruito i sistemi di dettatura e di trascrizione LVCSR con le risorse linguistiche di SAVAS;
  • ha integrato e valutato i sistemi sviluppati in varie situazioni di applicazione della sottotitolazione automatizzata per mostrare gli effetti dei dati audiovisivi condivisi sulla sottotitolazione automatizzata.

Acronimo:
SAVAS

Programma di Finanziamento:
7th Framework Programme

Ente Finanziatore:
European Commission

Contratto:
FP7-ICT-2011-SME-DCL-296371

Stato:
Ended

Responsabile Scientifico dell'Unità di Ricerca del CNR-ILC:
Monica Monachini

Staff:
Paola Baroni
Francesca Frontini

Sito/i web:
http://www.fp7-savas.eu