PANACEA

Acronimo: 
PANACEA
Titolo: 
Platform for Automatic, Normalized Annotation and Cost-Effective Acquisition of Language Resources for Human Language Technologies
Tipo di Progetto: 
Europeo
Ente Finanziatore: 
European Commission
Programma di Finanziamento: 
7th Framework Programme
Contratto: 
FP7-ICT-2009-248064
Data di Inizio: 
01/01/2010
Data di Fine: 
31/12/2012
Status: 
Terminato
Ruolo ILC: 
Beneficiario
Responsabile Scientifico del Progetto: 
Irina Prodanof
Tommaso Caselli
Francesca Strik Lievers

Una delle sfide strategiche dell’Europa nell’odierna economia globalizzata è quella di superare le barriere linguistiche con mezzi tecnologici.

In particolare, si auspica che i sistemi di Traduzione Automatica possano avere un effetto significativo sulla gestione del multilinguismo in Europa, andando incontro ai bisogni di centinaia di milioni di cittadini attraverso la traduzione di una ampia varietà di dati scritti e orali.

Il progetto PANACEA si è occupato dell’aspetto più critico della Traduzione Automatica: l’impasse lingua-risorsa.

Le Tecnologie Linguistiche presuppongono la disponibilità di una conoscenza strettamente dipendente dal linguaggio per poter implementare la vita reale, cioè richiedono delle Risorse Linguistiche.

Le Risorse Linguistiche di una determinata lingua non si possono mai considerare complete o definitive a causa delle caratteristiche tipiche del linguaggio naturale: i cambiamenti di una lingua e l'emergere di nuovi domini della conoscenza e di nuove varietà linguistiche.

La necessità costante di Risorse Linguistiche può essere soddisfatta soltanto attraverso un sistema automatico, dinamico e flessibile finalizzato alla annotazione, produzione e validazione delle Risorse Linguistiche, un sistema concepito come insieme di strumenti integrati per la produzione di Risorse Linguistiche.

L'obiettivo di PANACEA era costruire un laboratorio di Risorse Linguistiche in grado di automatizzare progressivamente le diverse fasi di acquisizione, produzione, aggiornamento e mantenimento delle Risorse Linguistiche così come richiesto dai sistemi di Traduzione Automatica, in aggiunta ad altre applicazioni di Tecnologia Linguistica e nei tempi richiesti.

Questa automazione può ridurre costi, tempi e sforzi umani in maniera significativa.

PANACEA ha utilizzato nuove metodologie per l’apprendimento automatico della conoscenza lessicale e  grammaticale di vaste quantità di testi e per presentare quella conoscenza in una forma prontamente utilizzabile dai sistemi di Traduzione Automatica e da altre applicazioni di Tecnologia Linguistica.

I moduli che effettuano queste operazioni sono stati integrati in un laboratorio virtuale web-based, che costituisce la colonna portante scalabile standardizzata e indipendente dalla lingua per le funzioni associate.

Un laboratorio che può produrre le Risorse Linguistiche desiderate con qualità e copertura minimale e senza alcun (o con un limitato) intervento umano.

Il laboratorio è stato convalidato attraverso un insieme predefinito di Risorse Linguistiche, valutandone le loro qualità.

L’elevata qualità delle Risorse Linguistiche prodotte da PANACEA secondo modalità altamente automatizzate possono rivoluzionare molte aree della Tecnologia Linguistica.

In particolare, PANACEA può migliorare la disponibilità e la qualità dei sistemi di Traduzione Automatica di tutte le lingue che dispongano di un numero sufficientemente ampio di corpora e di volumi.

I risultati di PANACEA sono stati presentati nei congressi più importanti della Tecnologia Linguistica (LREC, ACL, COLING, STATMT, MT Summit).

PANACEA ha organizzato due seminari, uno relativo ai agli aspetti scientifici e l’altro al tema del trasferimento tecnologico.