CWALM

Un modello lessicale basato sul corpus dell'arabo scritto contemporaneo

Tipo di progetto: National  |  Data inizio: 01/06/2022  |  Data di fine: 31/05/2025

L’arabo è stato tradizionalmente descritto in termini di diglossia: due livelli distinti della stessa lingua, uno superiore, scritto, formale (arabo classico/standard) e uno inferiore, orale, informale (diverse varietà di arabo parlato, i cosiddetti dialetti arabi) sono mescolati dai parlanti attraverso il cambio di codice o il mixaggio di codice.

Il progetto mira a creare una risorsa lessicografica per l’Arabo Scritto Contemporaneo (CWA), che tenga conto di materiali le cui caratteristiche si trovano in testi scritti in arabo del mondo reale, indipendentemente da una classificazione preliminare sulla base della loro natura linguistica. Pertanto, è fornito un nuovo approccio teorico che supera la descrizione tradizionale del sistema linguistico arabo in termini di diglossia e interpreta l’arabo come un complesso linguistico. Sarà prodotto un modello di prova finale, che mira a essere la prima risorsa convalidata su larga scala sul CWA che fornisce dati oggettivi e sostanziali per testare teorie concorrenti sullo stato linguistico della lingua araba e per dimostrare l’estensibilità del modello a una copertura più completa di CWA.

Il nuovo approccio consentirebbe di analizzare l’arabo nello stesso modo in cui altre lingue lo sono state per alcuni decenni all’interno della tradizione linguistica dei corpora, vale a dire come una lingua il cui lessico (e grammatica) può essere descritto in modo neutrale rispetto alla varietà dopo l’analisi di un corpus rappresentativo del linguaggio che si definisce secondo una serie di criteri esterni, oggettivi (come tempi, generi, aree).

La progettazione risultante della risorsa lessicale incoraggerà nuovi approcci in termini di insegnamento e apprendimento della lingua araba, superando l’annosa questione della diglossia.

Acronimo:
CWALM

Programma di Finanziamento:
PRIN 2020 – SH4

Ente Finanziatore:
MUR

Contratto:
B57G22000800006 (Prot. 20204EJYRX)

Stato:
Ongoing

Ruolo CNR-ILC:
Beneficiary

Coordinatore progetto:
Università degli studi Roma Tre

Responsabile Scientifico dell'Unità di Ricerca del CNR-ILC:
Ouafae Nahli

Staff:
Paola Baroni
Andrea Bellandi
Giulia Benotto
Elisa Gugliotta
Nadia Khlif
Noemi Terreni

Sito/i web:
https://cwalm.ilc.cnr.it