ILC Participation in BRIGHT 2015

Come scrivi? Esploriamo in modo automatico lo stile di un testo
(ItaliaNLP Lab - Italian Natural Language Processing Lab)

Le tecnologie linguistico-computazionali possono dirsi oggi mature per esplorare in modo affidabile non soltanto il contenuto di un testo, ma anche la sua forma linguistica. Attraverso l'analisi linguistica automatica è oggi possibile estrarre da un testo caratteristiche linguistiche che permettono di ricostruirne lo stile di scrittura. In questa presentazione verranno mostrati dei sistemi in grado di estrarre un'ampia serie di caratteristiche che variano tra diversi livelli di descrizione linguistica, come ad esempio quello lessicale e quello sintattico. Verrà illustrato come gli strumenti utilizzano queste caratteristiche sia per monitorare le abilità linguistiche di chi scrive rispetto ai diversi livelli scolastici, sia per valutare il livello di accessibilità del testo prodotto.

Di cosa parla? Esplorare in modo automatico il contenuto di un testo
(ItaliaNLP Lab - Italian Natural Language Processing Lab)

La necessità quotidiana di accedere a grandi quantità di dati per lo più testuali ha dato grande impulso allo sviluppo di tecnologie per l'acquisizione, la classificazione e la gestione automatica del contenuto testuale e al loro sempre più diffuso impiego in numerosi contesti applicativi. In questa presentazione verranno mostrati strumenti per l'acquisizione e l'organizzazione di informazione semantico-lessicale da grandi collezioni di testi. Questi strumenti sono in grado di analizzare il contenuto dei documenti, estrarre i termini e le entità potenzialmente più significativi, individuare le relazioni che legano termini e entità, utilizzare l'informazione estratta per indicizzare i documenti di partenza e costruire il grafo della conoscenza contenuta nella collezione di testi analizzati.

E io... traduco! Il computer al servizio della traduzione di testi antichi
(Gruppo Literary Computing)

Tradurre un testo antico può rivelarsi un compito arduo e richiedere conoscenze molto specifiche in ambito linguistico, storico e letterario. Il computer, attraverso i sistemi di Computer-Assisted Translation (CAT), può essere di aiuto nella traduzione di un testo. Tuttavia, il sistemi di CAT attualmente disponibili sono primariamente concepiti per velocizzare il processo di traduzione e mal si applicano ai testi la cui traduzione spesso si intreccia indissolubilmente con l’interpretazione.
Il sistema Traduco, progettato e sviluppato per la traduzione del Talmud babilonese in italiano, integra oggi caratteristiche specifiche che lo rendono adatto a supportare la traduzione di testi antichi.
Analogamente, anche lo studio di traduzioni già esistenti può trarre giovamento dalle applicazioni informatiche. Lo dimostra G2A, un sistema web sviluppato nell’ambito del progetto “Greek into Arabic” per lo studio comparato di testi greci in traduzione araba.

La fabbrica delle parole antiche. Latino e greco nei tempi della rete
(CoPhiLab - Laboratorio di Filologia Collaborativa)

Nell'era digitale, da un lato ci liberiamo sempre più dalle azioni ripetitive e a basso contenuto intellettuale eseguite silenziosamente dalle macchine, dall'altro ci possiamo dedicare a costruire, estendere e migliorare le nostre stesse risorse digitali. Avendo in mente questi due aspetti complementari, questa presentazione a) illustra i servizi web di analisi linguistica del Latino pensati per l’interazione fra macchina e macchina e b) mostra come far crescere la rete semantica del greco antico grazie al coinvolgimento di studenti e studiosi (citizen scholars).

Una parola tira l’altra: lessico e reti neurali
(ComPhys Lab - Laboratorio di Fisiologia della Comunicazione)

Come sono memorizzate le parole nel nostro cervello e come si organizzano tra loro? Quali meccanismi ne governano l'acquisizione, l'attivazione, il riconoscimento, il richiamo e la produzione? Un modo per rispondere a queste domande è quello di osservare il funzionamento di una Rete Neurale Artificiale, un programma del computer che simula il comportamento di centinaia o migliaia di neuroni che si scambiano segnali e modificano le loro connessioni sulla base degli stimoli ai quali sono esposti. Nei nostri esperimenti, gli stimoli sono parole, rappresentate come sequenze di simboli, che nella rete si trasformano in schemi di attivazione parallela di neuroni che competono tra loro. Durante l'acquisizione, la competizione da caotica raggiunge gradualmente un equilibrio dinamico: ad ogni parola viene associato uno schema univoco di attivazione, che rappresenta la traccia di memoria a lungo termine di quella parola nel nostro cervello.
Nei nostri esperimenti osserveremo gli stadi di addestramento della rete neurale artificiale che impara parole di diverse lingue (dall’italiano al tedesco, dall’inglese all’arabo), prima in contesti monolingui per poi passare ad evidenziare le difficoltà dell’apprendimento di una lingua straniera ed effetti di interferenza tra i lessici di più lingue.

Dati collegati: reti di parole, reti di concetti
(Gruppo LaRI - Language Resources and Infrastructures)

Il web semantico può essere visto come un “internet per le macchine”, dove i computer possono cercare, trovare, combinare informazioni strutturate in modo a loro comprensibile, ovvero organizzate in reti di concetti espressi in modo standardizzato.
L'ILC collabora con il W3C alla definizione delle specifiche per collegare lessici computazionali a reti di concetti e si impegna a pubblicare e collegare i suoi lessici nei nuovi formati al mondo "linked data" perché il web semantico possa essere interrogato e rispondere anche in italiano.

Dal verbo all’azione: come un computer può comprendere le istruzioni
(Gruppo LaRI - Language Resources and Infrastructures)

I verbi d'azione sono tra le parole più difficili da comprendere per i computer perché è necessario fornire loro informazione di tipo concreto relativa alla sequenza di azioni da compiere e alla caratteristiche percettive dell'oggetto. Può la linguistica computazionale fornire questo tipo di informazione? Una demo con materiale multimodale spiegherà la complessità del problema e le possibili soluzioni.

Nel mare non ci sono solo pesci ma anche parole e numeri
(Gruppo LaRI - Language Resources and Infrastructures)

Un motore semantico per la estrazione di informazione da documenti marini dedicato al settore della oceanografia operativa, i cui esperti hanno esigenza di accedere repentinamente e in maniera intelligente ai dati che le piattaforme di rilevazione, disposte al largo, raccolgono in tempo reale sullo stato del mare (correnti, temperatura, previsioni di onde) e di combinarle con informazioni contenute nella letteratura scientifica, al fine di migliorare i piani di gestione, monitoraggio e protezione del mare.


Back to ILC @ BRIGHT 2015