EUROWORDNET

Building a Multilingual Wordnet Database with Semantic Relations between Words

Tipo di progetto: European  |  Data inizio: 01/03/1996  |  Data di fine: 28/02/1999

EuroWordNet è un database multilingue con wordnet per parecchie lingue europee (fiammingo, italiano, spagnolo, tedesco, francese, ceco ed estone).

I wordnet sono strutturati nello stesso modo del wordnet americano per l’inglese (Princeton WordNet) [Miller et al 1990], in termini di synset (serie di parole sinonimiche) con interrelazioni semantiche di base.

Ciascun wordnet rappresenta un unico sistema interno di lessicalizzazione del linguaggio.

Inoltre, i wordnet sono collegati ad un Inter-Lingual Index, basato sul Princeton WordNet.

Attraverso questo indice, le lingue sono interconnesse in modo tale che sia possibile procedere dalle parole di una lingua a parole simili di qualsiasi altra lingua.

L’indice dà anche accesso ad una top-ontology condivisa di 63 distinzioni semantiche.

Questa top-ontology offre una cornice semantica comune per tutte le lingue, mentre proprietà specifiche della lingua sono mantenute nei wordnet individuali.

Il database può essere usato, tra l’altro, per il reperimento di informazioni monolingue e inter-lingua, il che è stato dimostrato dagli utenti nel progetto.

Il progetto EuroWordNet è stato completato nell’estate del 1999.

Il design del database, le relazioni definite, la top-ontology e l’Inter-Lingual Index sono ora consolidati.

Tuttavia, molti altri istituti e gruppi di ricerca stanno sviluppando wordnet simili in altre lingue (comunitarie ed extracomunitarie) usando la specifica EuroWordNet.

Se compatibile, questi wordnet possono essere aggiunti al suddetto database e, attraverso l’indice, connessi a qualsiasi altro wordnet.

Il formato EuroWordNet è definito dallo EuroWordNet Database Editor Polaris.

Una specificazione può essere trovata nel manuale dell’utente del database.

Per quel che ne sappiamo dei wordnet sono attualmente sviluppati per lo svedese, il norvegese, il danese, il greco, il portoghese, il basco, il catalano, il rumeno, il lituano, il russo, il bulgaro e lo sloveno.

La cornice cooperativa di EuroWordNet è continuata attraverso la Global WordNet Association.

Essa è una libera e pubblica associazione che costruisce su EuroWordNet e sulla Princeton WordNet.

Il suo scopo è stimolare un’ulterione creazione di wordnet, un’ulteriore standardizzazione ed interconnessione, lo sviluppo di tools e la disseminazione di informazioni.

Acronimo:
EUROWORDNET

Programma di Finanziamento:
4th Framework Programme

Ente Finanziatore:
European Commission

Contratto:
FP4-TELEMATICS2C-LE2-4003

Stato:
Ended

Ruolo CNR-ILC:
Beneficiary

Staff:
Adriana Roventini
Rita Marinelli
Francesca Bertagna

Sito/i web:
http://www.illc.uva.nl/EuroWordNet/