Tipo di progetto: European | Data inizio: 01/05/2012 | Data di fine: 30/04/2014
Il progetto SAVAS ha raccolto le risorse parlate e testuali di sei lingue comunitarie, sviluppando Large Vocabulary Continuous Speech Recognizers (LVCSR): riconoscitori continui del parlato di un vasto vocabolario a dominio specifico per risolvere le esigenze di sottotitolazione automatizzata nell’industria dei media.
Più specificamente, gli obiettivi principali del progetto erano i seguenti:
- rendere più efficace l’aquisizione e l’annotazione di risorse linguistiche audiovisive prodotte dai presentatori televisivi e dalle aziende che si occupano di sottotitolazione per lo sviluppo di sistemi LVCSR finalizzati alla sottotitolazione automatizzata;
- utilizzare una piattaforma per condividere le risorse linguistiche audiovisive di lingua fra industria dei media e sviluppatori di LVCSR attraverso i metodi legali e commerciali più adatti di scambio dei dati;
- mostrare gli effetti sulla tecnologia LVCSR delle attuali risorse linguistiche audiovisive utilizzate per la sottotitolazione automatizzata.
Per realizzare questi obiettivi, SAVAS:
- ha raccolto risorse parlate e testuali nelle lingue affrontate dai presentatori televisivi e dalle aziende che fornivano i dati all’interno del consorzio;
- ha trascritto e annotato i corpora raccolti in una forma adatta ad “addestrare” i modelli linguistici ed acustici dei sistemi LVCSR, usando una combinazione di metodi automatici e collaborativi;
- ha costruito un archivio META-SHARE locale contenente le risorse linguistiche SAVAS raccolte ed annotate, per permettere una loro riutilizzazione;
- ha adattato e istruito i sistemi di dettatura e di trascrizione LVCSR con le risorse linguistiche di SAVAS;
- ha integrato e valutato i sistemi sviluppati in varie situazioni di applicazione della sottotitolazione automatizzata per mostrare gli effetti dei dati audiovisivi condivisi sulla sottotitolazione automatizzata.
Acronimo:
SAVAS
Programma di Finanziamento:
7th Framework Programme
Ente Finanziatore:
European Commission
Contratto:
FP7-ICT-2011-SME-DCL-296371
Stato:
Ended
Responsabile Scientifico dell'Unità di Ricerca del CNR-ILC:
Monica Monachini
Staff:
Paola Baroni
Francesca Frontini
Sito/i web:
http://www.fp7-savas.eu