Una piattaforma aperta e collaborativa per l’annotazione del testo, la lessicografia digitale e il Lexical Linking
Maia è uno strumento web aperto e collaborativo basato sul web semantico e sulle tecnologie linked open data per l’annotazione del testo, la lessicografia digitale e il Lexical Linking, progettato e sviluppato principalmente per l’uso da parte degli umanisti digitali. È stato concepito, progettato e sviluppato per rispondere all’esigenza espressa dagli studiosi di lavorare nello stesso ambiente, combinando un corpus di riferimento per la costruzione di risorse e connessioni formali tra elementi lessicali e testuali.
L’ambiente di lavoro collaborativo sviluppato comprende sia il testo sia il lessico, consentendo l’annotazione del testo con informazioni aggiuntive e la costruzione del lessico sulla base di modelli lessicali consolidati. Attraverso il collegamento tra le annotazioni testuali e gli elementi del lessico, diventa possibile stabilire una connessione formale tra le voci, le forme o i sensi lessicali e le rispettive occorrenze in un corpus di riferimento, che può essere strutturato in cartelle e sottocartelle.
Principali caratteristiche di MAIA
Maia fornisce un ambiente integrato che offre molteplici vantaggi:
- nell’ambito di un compito di costruzione (o revisione) di una risorsa lessicale o terminologica, è possibile consultare i documenti utilizzati come fonti testuali all’interno dello stesso ambiente. La possibilità di effettuare ricerche nei testi, di annotare parti specifiche e di collegare queste annotazioni agli elementi del lessico può, ad esempio, consentire di definire un termine polisemico nei suoi vari significati e di collegare i vari sensi creati alle rispettive occorrenze nel testo. In questo modo, sarà possibile avere una serie di contesti per ogni voce lessicale, forma o senso definito nel lessico, sia per un riferimento interno allo strumento sia per una potenziale esportazione come esempi di occorrenze sotto forma di dizionari elettronici.
- la natura collaborativa di Maia consente la creazione di progetti di lavoro condivisi (che possono riguardare l’annotazione di testi, la costruzione di lessici o una combinazione di entrambi) che coinvolgono più studiosi, ognuno dei quali può concentrarsi su porzioni specifiche del dataset, consentendo un lavoro parallelo.
Prospettive di sviluppo di Maia
- estensione delle funzionalità di ricerca, sia per il corpus sia per il lessico, con una sezione dedicata alla ricerca su base linguistica supportata dalla risorsa lessicale.
- possibilità di creare e di modificare ontologie all’interno dello stesso ambiente: questo lavoro consentirà di collegare direttamente le annotazioni testuali ai concetti dell’ontologia e di collegare i sensi della risorsa lessicale a questi concetti. Ciò introdurrà un livello concettuale nella risorsa complessiva, distinto dal livello linguistico-semantico. In un primo momento, Maia consentirà di importare e di visualizzare le ontologie OWL, mentre la parte di editing sarà sviluppata successivamente.
- funzioni di importazione ed esportazione dei dati per il corpus testuale e per le risorse lessicali. Inizialmente, sarà possibile importare testi pre-annotati in un formato simile a quello di CoNLL (che potranno poi essere rivisti manualmente nel sistema) e risorse lessicali in formato RDF conformi al modello OntoLex-Lemon40. I dati saranno quindi esportabili negli stessi formati. Successivamente, saranno inclusi altri formati di importazione ed esportazione per soddisfare le esigenze degli utenti di diverse comunità.
- aggiornamenti che coinvolgono la componente di annotazione (per facilitare il lavoro di annotazione in un contesto collaborativo, TextO include già servizi di versioning).
- creazione di collegamenti tra le annotazioni: attraverso questa funzione sarà possibile definire, ad esempio, relazioni anaforiche o sintattiche.
MAIA è in fase di sviluppo.
Per maggiori dettagli sulla prima versione di MAIA:
Giovannetti, E., Albanesi, D., Bellandi, A., Marchi, S., Papini, M., & Sciolette, F. (2024). Maia: an Open Collaborative Platform for Text Annotation, E-Lexicography, and Lexical Linking. Umanistica Digitale, 8(18), 27–52. https://doi.org/10.6092/issn.2532-8816/19705