Laboratorio di Linguistica Computazionale


    Responsabile: Alessandro Lenci (alessandro.lenci@ling.unipi.it)

    Sito web: http://colinglab.humnet.unipi.it/

    Creato nel 2006, il Laboratorio di Linguistica Computazionale è dotato di computer e software per il trattamento automatico della lingua, analisi statistiche e creazione di risorse lessicali e di corpora annotati. Le attività del laboratorio vertono sui seguenti temi:

    • creazione e gestione di corpora annotati e risorse lessicali;
    • sviluppo di strumenti per l’analisi computazionale del linguaggio basati su tecniche simboliche e statistiche;
    • creazione di modelli e di simulazioni computazionali per lo studio cognitivo del linguaggio;

    sviluppo di applicazioni informatiche basate sull’analisi computazionale del linguaggio.

    Collaborazioni con centri di ricerca nazionali e internazionali:

    – Istituto di Linguistica Computazionale del CNR di Pisa (ILC-CNR)

    – Centro Interdisciplinare Mente e Cervello dell’Università di Trento

    Tavolo per la Ricerca sulla Parola e sul Lessico (TRIPLE) presso l’Università di Roma 3

    – Dipartimento di Informatica dell’Università di Pisa,

    – Institut für Maschinelle Sprachverarbeitung (IMS) dell’Università di Stuttgart (Germania).

    Progetti attivi:

    Distributional Memory (DM): modello di semantica distribuzionale, sviluppato in collaborazione con Marco Baron (Università di Trento).

    LexIt: database on line per l’esplorazione di profili distribuzionali di nomi, verbi e aggettivi italiani, estratti automaticamente da corpora;

    Combinazioni di parole in italiano: analisi teorica e descrittiva, modelli computazionali, studio di un layout lessicografico dedicato e realizzazione di un dizionario di combinazioni: responsabile di un’Unità di Ricerca all’interno del progetto triennale finanziato dal MIUR (PRIN 2010-2011), coordinato dal Prof. Raffaele Simone (Università of Roma 3), finalizzato allo sviluppo di metodi computazionali per l’estrazione di informazione distribuzionale da corpora;

    Italian FrameNet: progetto finalizzato alla creazione di un corpus annotato con frame semantici, secondo l’approccio del FrameNet di Berkeley (in collaborazione con ILC-CNR, FBK, Università di Trento e Università di Roma Tor Vergata)