CIP – Corpus of Italian language for Preschoolers

Corpus in lingua italiana per bambini in età prescolare. Lessico rivolto a bambini italiani in età prescolare dai 3 ai 6 anni raccolto da fonti eterogenee in italiano e in lingua dei segni italiana

Tipo di progetto: National  |  Data inizio: 05/10/2023  |  Data di fine: 04/10/2025

Il progetto CIP – Corpus of Italian language for Preschoolers ha l’obiettivo di creare risorse per lo studio del lessico nella lingua italiana e nella lingua dei segni italiana, destinate ai bambini in età prescolare. Al termine del progetto, le risorse comprenderanno un corpus linguistico, gli strumenti necessari per accedervi ed estrarne informazioni, oltre a un dizionario campione.

I dati alla base del corpus sono raccolti attraverso l’osservazione di una varietà di contesti e situazioni, tra cui interazioni adulto-bambino, libri per l’infanzia, cartoni animati e altri media.

L’unità CNR-ILC si occuperà dell’identificazione di fonti scritte, della loro trascrizione e lemmatizzazione.

Acronimo:
CIP - Corpus of Italian language for Preschoolers

Programma di Finanziamento:
Progetti di Ricerca di Rilevante Interesse Nazionale (PRIN). Finanziato dall’Unione Europea – Next Generation EU nell’ambito del progetto PNRR M4C2 - Investimento 1.1

Ente Finanziatore:
MUR

Contratto:
2022NPXYHH_PRIN 2022_SH4

Stato:
Ongoing

Ruolo CNR-ILC:
Beneficiary

Coordinatore progetto:
Pasquale Rinaldi, CNR-ISTC

Responsabile Scientifico dell'Unità di Ricerca del CNR-ILC:
Davide Chiarella

Staff:
Paola Cutugno
Alessandra Cinini
Chiara Bolognesi
Noemi Terreni