Titolo:
Studio della complessità linguistica e prospettive applicative
Data:
09/07/2015
Città:
Pisa
Luogo:
ILC-CNR – Aula Seminari IBF SG 5
Descrizione:
Sebbene la semplificazione automatica del testo rappresenti un’area di ricerca di estrema attualità nell’ambito della comunità internazionale di NLP, e con ricadute applicative importanti in chiave di accessibilità, sono ancora molto limitati gli studi sulla lingua italiana. In questo contributo ci proponiamo di documentare lo stato attuale delle nostre ricerche sul tema, che hanno portato alla costruzione di una prima risorsa per l’italiano concepita per lo studio della semplificazione automatica e semi-automatica del testo. Saranno illustrati i presupposti teorici e la metodologia seguita per la creazione di questa risorsa – che si presenta come un “corpus parallelo monolingua” – nonché le prime analisi quantitative che mostrano come le principali operazioni di semplificazione rintracciate nel corpus abbiano non solo un’evidente correlazione con alcune caratteristiche di complessità linguistica estratte automaticamente dal testo, ma anche una diversa distribuzione in base al tipo di “strategia” adottata dall’esperto umano per semplificare il testo. Questi dati costituiscono il punto di partenza per la creazione di un sistema di semplificazione semi-automatica flessibile, ovvero specializzato per lettori e domini diversi.
Relatore/i:
Dominique Brunato
Presentazioni: