Aree di Competenza

Aree di Competenza

Risorse Linguistiche, Standard e Infrastrutture di Ricerca

La ricerca nel settore dell'Ingegneria del Linguaggio e il ciclo di produzione delle risorse linguistiche sono ottimizzati tramite l'adozione di standard, lo scambio di buone pratiche per l'interoperabilità, il riciclo e riutilizzo dei risultati disponibili in termini di dati e strumenti. L'obiettivo di questa linea strategica è la definizione di modelli per la creazione, la rappresentazione, l'estensione e il mantenimento di lessici computazionali, repertori terminologici e ontologici, corpora e tecnologie linguistiche. Le soluzioni tecnologiche messe a punto in questo ambito sono rivolte allo sviluppo di un'infrastruttura di ricerca distribuita e cooperativa, volta a stabilire nuove funzionalità di accesso, interoperabilità e condivisione di risorse e strumenti linguistici.

Trattamento Automatico del Linguaggio ed Estrazione di Conoscenza

Le tecniche sviluppate consentono di accedere in modo automatico al contenuto di un testo e di rispondere ad una vasta gamma di bisogni informativi dei parlanti: dall'accesso su base semantica al contenuto testuale fino alla valutazione della struttura del testo come indicatore della sua accessibilità ed efficacia comunicativa. Le soluzioni tecnologiche proposte rispondono alle necessità di ricerca e gestione "intelligente" dell'informazione contenuta all'interno di grandi basi documentali e possono essere utilizzate in numerose applicazioni commerciali per rispondere ai bisogni della società.

Modelli (Bio-)Computazionali dell'Uso Linguistico

Sono analizzati i fattori che governano i processi di comprensione, produzione, apprendimento e variazione di una lingua, e le interazioni dinamiche tra di essi. In particolare, i modelli teorici dell'uso linguistico e la loro verifica empirica sono sviluppati tramite: metodi probabilistici per lo studio di corpora, lessici e basi di dati; simulazioni computazionali; studio di evidenza linguistica di natura sperimentale, clinica e acquisizionale. Le metodologie di rappresentazione formale e modellazione simbolica sono coniugate con i metodi, i dati e gli strumenti d'indagine di settori disciplinari più orientati all'analisi dell'uso linguistico in contesti finalizzati e controllati, quali la psico- e la neuro-linguistica, la sociolinguistica e la glottodidattica.

Digital Humanities

Le acquisizioni e conoscenze delle scienze informatiche sono coniugate con gli approcci metodologici e i modelli teorici dell'analisi e della filologia del testo, contribuendo così alla trasformazione delle modalità di conservazione, fruizione, studio e pubblicazione dei documenti letterari, archivistici e bibliotecari. Le soluzioni tecnologiche sviluppate offrono nuove prospettive di indagine e condivisione e si integrano in un sistema "multi-modulare" a componenti indipendenti, ma interconnessi, da cui le diverse metodologie di accesso, gestione, studio e revisione del testo possono trarre vantaggio e opportunità di interazione/integrazione.

Alcune delle competenze specifiche dell'ILC sono:
  • standardizzazione di risorse linguistiche;
  • progettazione e costruzione di lessici computazionali per lingue diverse;
  • progettazione e costruzione di corpora testuali e multimodali;
  • progettazione e costruzione di ontologie;
  • infrastrutture di ricerca per la validazione e la distribuzione di risorse e tecnologie linguistiche;
  • salvaguardia delle lingue minoritarie;
  • Digital Humanities;
  • Machine Learning;
  • Information Extraction and Retrieval;
  • piattaforme di annotazione linguistica automatica multi-livello del testo;
  • metodi e tecniche di semplificazione linguistica;
  • metodi e tecniche di valutazione delle competenze linguistiche;
  • estrazione di conoscenza terminologica e ontologica da basi documentali di dominio;
  • sistemi di Sentiment Analysis e Opinion Mining;
  • tecnologie per il Semantic Web;
  • modelli computazionali dell'uso linguistico;
  • sistemi di traduzione assistita;
  • piattaforme per l'analisi testuale.