CNR-ILC ad AIUCD2026

Anche quest’anno Cnr-Istituto di Linguistica Computazionale “Antonio Zampolli” (CNR-ILC) sarà presente al XV convegno annuale dell’Associazione per l’Informatica Umanistica e la Cultura Digitale (AIUCD). L’edizione 2026, dal titolo “Digitale e Public Engagement: pratiche e prospettive nelle Digital Humanities”, esplora come le tecnologie digitali aprono nuove forme di partecipazione attiva nella ricerca umanistica. Dalla co-creazione con le comunità ai processi collaborativi di documentazione e valorizzazione del patrimonio culturale: il convegno AIUCD 2026 mette al centro pratiche, strumenti e metodologie che rendono la conoscenza più aperta, condivisa e inclusiva.

I contributi di CNR-ILC

Ad AIUCD 2026 saranno presentati alcuni risultati di ricerca dell’Istituto:

Mercoledì 3 giugno · 17:40 – 18:10 2A · Aula 5A
Un LLM per le Scienze Umane e Sociali? ReSearch_SSH come esperimento europeo
Francesca Frontini (CNR-ILC); Alessio Miaschi (CNR-ILC)

L’adozione dei Large Language Models (LLM) nel contesto della ricerca scientifica, in particolare per attività di ricerca e scoperta bibliografica, solleva questioni rilevanti per le Scienze Umane e Sociali (SSH), soprattutto in relazione alla diversità delle pratiche disciplinari e alla valutazione dei risultati. Questo contributo presenta ReSearch_SSH, un caso d’uso sviluppato nel contesto del progetto europeo LLMs4EU e dell’infrastruttura ALT-EDIC, come esperimento di adattamento e valutazione di modelli linguistici orientato alle pratiche di ricerca nelle SSH e, più specificamente, nelle Digital Humanities. Il lavoro descrive l’architettura metodologica del caso d’uso, basata su strategie di domain alignment, task-oriented fine-tuning e su un approccio GraphRAG integrato con infrastrutture di scienza aperta come ISIDORE e ISTEX. Particolare attenzione è dedicata alle risorse dati multilingui, ai requisiti di fattualità e tracciabilità delle fonti e a un modello di valutazione qualitativa fondato sul coinvolgimento di un panel di esperti delle Digital Humanities. Il contributo si colloca nel dibattito delle Digital Humanities sugli LLM come componenti infrastrutturali per la ricerca, proponendo un approccio orientato alle pratiche disciplinari e alla partecipazione delle comunità scientifiche per guidare in modo critico lo sviluppo e la valutazione di sistemi di ricerca e scoperta basati su LLM in ambito SSH.

Mercoledì 3 giugno · 18:30–18:40 2A · Aula 5A
Per una formazione del filologo computazionale del futuro: Domain Specific Language e Large Language Model
Christian D’Agata (Università di Catania); Angelo Mario Del Grosso (CNR-ILC); Federico Boschetti (CNR-ILC)

L’articolo presenta la progettazione e la sperimentazione di un prototipo di syllabus universitario che integra Domain Specific Language (DSL) e Large Language Model (LLM), mostrando come tale integrazione favorisca forme scientifiche di editing digitale collaborativo, coniugando riflessione critica e uso consapevole dell’intelligenza artificiale generativa. In questo quadro, gli LLM sono in grado di supportare la progettazione dei DSL, l’estensione controllata delle annotazioni, la loro analisi e la traduzione verso formati strutturati e ambienti di pubblicazione come TEIPublisher.

Giovedì 4 giugno · 15:40–16:00 5A · Aula 5A
Risorse terminologiche e Linked Open Data: il Glossario delle Infrastrutture di Ricerca (GIR) come caso di studio
Lucia Francalanci (OVI-CNR); Alessia Scognamiglio (CNR-ISPF); Giulia Pedonese (CNR-ILC); Michele Mallia (CNR-ILC); Irene Falini (Università Telematica Pegaso); Fahad Khan (CNR-ILC)

Negli ultimi anni, la crescente attenzione verso l’interoperabilità dei dati, la Scienza Aperta e le Infrastrutture di Ricerca ha reso sempre più centrale la disponibilità di risorse terminologiche strutturate in grado di supportare la comunicazione scientifica, il dialogo interdisciplinare e il riuso dei prodotti della ricerca. In tale contesto, glossari e repertori terminologici non svolgono più soltanto una funzione descrittiva o divulgativa, ma si configurano come strumenti centrali per la rappresentazione della conoscenza e per l’allineamento semantico tra domini, comunità e sistemi informativi. La progettazione di tali risorse secondo il paradigma dei Linked Open Data solleva tuttavia questioni metodologiche ancora aperte, soprattutto nel caso di risorse in lingua italiana caratterizzate da elevata specializzazione e polisemia. Il contributo presenta e discute criticamente le scelte metodologiche adottate per la modellizzazione LOD del Glossario delle Infrastrutture di Ricerca (GIR), assumendolo come caso di studio. Il modello proposto distingue esplicitamente tra entrata lessicale, uso contestuale e concetto terminologico, articolandosi su tre livelli che integrano OntoLex-Lemon e SKOS. Particolare attenzione è dedicata al livello dell’uso, inteso come unità centrale per la rappresentazione della polisemia e dei processi di specializzazione e risemantizzazione tipici del lessico tecnico-scientifico. Si intende così offrire una riflessione metodologica replicabile per la progettazione di risorse terminologiche in ambiente Linked Open Data. Il modello proposto deriva da un processo di mediazione tra esigenze redazionali, complessità linguistica e interoperabilità semantica, che si traduce in un equilibrio negoziato tra aderenza agli standard del Web Semantico e usabilità effettiva della risorsa.

Venerdì 5 giugno · 9:00–9:20 6A · Aula 5A
Verso un dizionario narrativo computazionale degli usi linguistici in aree ad alta vulnerabilità sociale
Michela Bandini (CNR-ILC); Silvia Piccini (CNR-ILC); Andrea Bellandi (CNR-ILC); Emiliano Giovannetti (CNR-ILC)

Questo contributo presenta la costruzione di un dizionario narrativo computazionale del linguaggio giovanile in contesti di vulnerabilità sociale, sviluppato attraverso un corpus orale di interviste nell’area napoletana nell’ambito di un progetto di Ricerca-Azione. L’analisi integra approcci qualitativi e quantitativi per indagare le strategie definitorie dei parlanti, alla luce della distinzione bruneriana tra pensiero paradigmatico e narrativo. I risultati confluiscono in un dizionario non-standard pensato come una rete concettuale formalizzata secondo il modello OntoLex-Lemon, in linea con i principi FAIR dei Linguistic Linked Open Data.

Poster

A Workflow-Centred Approach to Managing Semantic Artifacts as Linked Open Data
Michele Mallia (CNR-ILC), Fahad Khan (CNR-ILC), Valeria Quochi(CNR-ILC)
Area tematica: Dati e conoscenza
Il restauro testuale dei papiri nel progetto GreekSchools: CoPhiEditor e l’integrazione di modelli linguistici
Simone Zenzaro (CNR-ILC), Federico Boschetti (CNR-ILC), Angelo Mario Del Grosso (CNR-ILC), Graziano Ranocchia (Università di Pisa)
Area tematica: DH e co-costruzione
Verso un grande corpus diacronico dell’italiano: il contributo degli esempi del GDLI
Eva Sassolini (CNR-ILC), Marco Biffi (Università di Firenze), Sebastiana Cucurullo (CNR-ILC), Simonetta Montemagni (CNR-ILC)
Area tematica: Memorie e patrimonio
Strategie di protezione, governance e sostenibilità degli archivi orali
Rosaria Deluca (CNR-IIT), Elvira Mercatanti (CNR-ILC), Monica Monachini (CNR-ILC)
Area tematica: Archivi ed edizioni

Atti del XV Convegno Annuale AIUCD