ISST-TANL Corpus

ISST-TANL Corpus è un corpus annotato manualmente, codificato nel formato standard CoNLL e comprendente la marcatura PoS e l’annotazione di dipendenza sintattica. Sviluppato congiuntamente da Cnr-Istituto di Linguistica Computazionale “Antonio Zampolli” (CNR-ILC) e Università di Pisa, esemplifica l’uso generale della lingua ed è costituito da articoli estratti da giornali e periodici, selezionati per coprire un’alta molteplicità di argomenti. Questo corpus è stato utilizzato per la formazione e la sperimentazione nell’attività condivisa “Adattamento di Dominio per Analisi di Dipendenze” di EVALITA 2011.