PANACEA

Platform for Automatic, Normalized Annotation and Cost-Effective Acquisition of Language Resources for Human Language Technologies

Tipo di progetto: European  |  Data inizio: 01/01/2010  |  Data di fine: 31/12/2012

Una delle sfide strategiche dell’Europa nell’odierna economia globalizzata è quella di superare le barriere linguistiche con mezzi tecnologici.

In particolare, si auspica che i sistemi di Traduzione Automatica possano avere un effetto significativo sulla gestione del multilinguismo in Europa, andando incontro ai bisogni di centinaia di milioni di cittadini attraverso la traduzione di una ampia varietà di dati scritti e orali.

Il progetto PANACEA si è occupato dell’aspetto più critico della Traduzione Automatica: l’impasse lingua-risorsa.

Le Tecnologie Linguistiche presuppongono la disponibilità di una conoscenza strettamente dipendente dal linguaggio per poter implementare la vita reale, cioè richiedono delle Risorse Linguistiche.

Le Risorse Linguistiche di una determinata lingua non si possono mai considerare complete o definitive a causa delle caratteristiche tipiche del linguaggio naturale: i cambiamenti di una lingua e l’emergere di nuovi domini della conoscenza e di nuove varietà linguistiche.

La necessità costante di Risorse Linguistiche può essere soddisfatta soltanto attraverso un sistema automatico, dinamico e flessibile finalizzato alla annotazione, produzione e validazione delle Risorse Linguistiche, un sistema concepito come insieme di strumenti integrati per la produzione di Risorse Linguistiche.

L’obiettivo di PANACEA era costruire un laboratorio di Risorse Linguistiche in grado di automatizzare progressivamente le diverse fasi di acquisizione, produzione, aggiornamento e mantenimento delle Risorse Linguistiche così come richiesto dai sistemi di Traduzione Automatica, in aggiunta ad altre applicazioni di Tecnologia Linguistica e nei tempi richiesti.

Questa automazione può ridurre costi, tempi e sforzi umani in maniera significativa.

PANACEA ha utilizzato nuove metodologie per l’apprendimento automatico della conoscenza lessicale e  grammaticale di vaste quantità di testi e per presentare quella conoscenza in una forma prontamente utilizzabile dai sistemi di Traduzione Automatica e da altre applicazioni di Tecnologia Linguistica.

I moduli che effettuano queste operazioni sono stati integrati in un laboratorio virtuale web-based, che costituisce la colonna portante scalabile standardizzata e indipendente dalla lingua per le funzioni associate.

Un laboratorio che può produrre le Risorse Linguistiche desiderate con qualità e copertura minimale e senza alcun (o con un limitato) intervento umano.

Il laboratorio è stato convalidato attraverso un insieme predefinito di Risorse Linguistiche, valutandone le loro qualità.

L’elevata qualità delle Risorse Linguistiche prodotte da PANACEA secondo modalità altamente automatizzate possono rivoluzionare molte aree della Tecnologia Linguistica.

In particolare, PANACEA può migliorare la disponibilità e la qualità dei sistemi di Traduzione Automatica di tutte le lingue che dispongano di un numero sufficientemente ampio di corpora e di volumi.

I risultati di PANACEA sono stati presentati nei congressi più importanti della Tecnologia Linguistica (LREC, ACL, COLING, STATMT, MT Summit).

PANACEA ha organizzato due seminari, uno relativo ai agli aspetti scientifici e l’altro al tema del trasferimento tecnologico.

Acronimo:
PANACEA

Programma di Finanziamento:
7th Framework Programme

Ente Finanziatore:
European Commission

Contratto:
FP7-ICT-2009-248064

Stato:
Ended

Ruolo CNR-ILC:
Beneficiary

Staff:
Alessandro Enea
Monica Monachini
Claudia Soria
Roberto Bartolini
Paola Baroni
Valeria Quochi
Riccardo Del Gratta
Irene Russo
Francesca Frontini
Irina Prodanof
Tommaso Caselli
Francesca Strik Lievers

Sito/i web:
http://www.panacea-lr.eu