Linguistica dei corpora: metodologia e costruzione di risorse per le lingue scarsamente dotate

Linguistica dei corpora: metodologia e costruzione di risorse per le lingue scarsamente dotate
a cura di Ouafae Nahli, ricercatrice del Cnr-Istituto di Linguistica Computazionale “Antonio Zampolli” (CNR-ILC).


18 marzo 2024 – 11.00 – 13.00
Alma Mater Studiorum Università di Bologna, Aula Magna, Via Filippo Re 6

organizzano Ines Peta e Chiara Fontana dell’Alma Mater Studiorum Università di Bologna


L’avvento della linguistica dei corpora ‒ ovvero l’esplorazione mediante la tecnologia digitale delle regolarità linguistiche che emergono da determinati corpora di testi ‒ consentono di fornire soluzioni innovative per la descrizione della struttura del linguaggio e lo sviluppo di programmi informatici per lo studio delle fonti.

Alcune lingue, in particolare quelle europee, hanno beneficiato di queste innovazioni tecnologiche, mentre altre lingue sono rimaste significativamente sprovviste di risorse digitali a supporto.

Obiettivo dell’intervento è riflettere sulle metodologie per lo studio dei corpora di lingue scarsamente dotate, con particolare riferimento all’arabo. Sarà illustrata la metodologia impiegata per lo studio del dialetto marocchino nell’ambito del progetto PRIN “A Lexical Corpus-based Model of Contemporary Written Arabic”.