LINGUISTICA COMPUTAZIONALE

Settore: L-LIN/01Codice: 305LLCrediti: 12Semestre: 1
Docenti: Lenci Alessandro, Dell’Orletta Felice

Obiettivi di apprendimento

Conoscenze

Lo studente avrà acquisito conoscenze in merito agli strumenti e alle metodologie per l'analisi computazionale dei testi e le tecnologie per il trattamento automatico della lingua

Modalità di verifica delle conoscenze

L'accertamento delle conoscenza verrà svolto attraverso:

  • prova scritta (divisa in due parti), nella quale lo studente dovrà dimostarre la conoscenza dei temi svolti a lezioni e dei testi di esame rispondendo a domande aprte e risolvendo esercizi. la prova scritta si terrà  in occasione di ogni appello di esame. In alternativa, gli stuenti frequentanti potranno sostenere due prove in itinere
  • realizzazione di un progetto sui temi delle esercitazioni di laboratorio
  • prova orale, in cui verrà discussa la prova scritta e il progetto

 

un elaborato scritto previsto all'inizio di ogni sessione d'esame e un progetto di analisi computazionale del testo

Capacità

Lo studente saprà utilizzare le tecniche di base per l'analisi computazionale dei testi e imparerà a usare l'ambiente di programmazione Python NLTK per lo sviluppo di moduli per il trattamento automatico della lingua

Modalità di verifica delle capacità

Lo studente realizzerà un progetto di costruzione e analisi computazionale di un corpus con NLTK

Comportamenti

Lo studente potrà acquisire e/o sviluppare sensibilità alle problematiche legate all'analisi quantiativa e computazionale del testo e al trattamento automatico della lingua

Saranno acquisite accuratezza e precisione nello raccolta e analisi computazionale di dati linguistici

Modalità di verifica dei comportamenti

Durante le sessioni di laboratorio saranno valutati il grado di accuratezza e precisione delle attività svolte

Prerequisiti

Nozioni di base di linguistica generale (morfologia, sintassi e semantica)

Nozioni di base di programmazione

Prerequisiti per studi successivi

Linguistica computazionale II nella Laurea Magistrale in Informatica Umanistica

Indicazioni metodologiche

Lezioni: frontali

Modalità di apprendimento:

  • frequenza delle lezioni
  • studio individuale
  • attvità di laboratorio

Frequenza: raccomandata

Metodi di insegnamento:

  • lezioni
  • laboratorio

 

Programma

Il corso ha lo scopo di presentare i temi principali della linguistica computazionale e del “Natural Language Processing” (NLP) e di familiarizzare lo studente con gli strumenti di base per l’analisi quantitativa e computazionale del testo.

Lezioni teoriche

1. Analisi computazionale dei dati linguistici

  • corpora: tipologia e uso
  • codifica e rappresentazione dei dati linguistici
  • analisi statistica dei dati linguistici
  • linguaggio e probabilità: modelli di markov, entropia, legge di Bayes
  • metodi computazionali per l'esplorazione dei dati linguistici: concordanze, collocazioni e misure di associazione

2. Natural Language Processing (NLP)

  • metodi a regole e di machine learning
  • corpora annotati per lo sviluppo di strumenti di NLP
  • analisi morfologica: Automi e Trasduttori a Stati Finiti
  • Part of Speech Tagging
  • analisi sintattica: chunking e shallow parsing, grammatiche context-free, cenni di parsing a costituenti e a dipendenze, probabilistic context free grammars
  • metodi di valutazione
  • lessici semantici computazionali: Wordnet e FrameNet
  • Word sense disambiguation

Esercitazioni

  • espressioni regolari
  • introduzione a NLTK
  • analisi computazionali del testo con NLTK
  • annotazioni semantiche del testo

Bibliografia

Testi la cui conoscenza è oggetto di verifica all'esame:

Testo di consultazione per le esercitazioni:

Non frequentanti

Testi la cui conoscenza è oggetto di verifica all'esame:

Testo di consultazione per la realizzazione del progetto:

Gli studenti non frequentanti DEVONO contattare preventivamente il docente

Modalità di esame

Esame scritto + progetto

L'esame scritto, diviso in due prove, può essere sostenuto o come compiti in itinere durante il corso oppure in occasione degli appelli scritti (le  due prove scritte possono essere sostenute anche in appelli differenti). Le prove in itinere possono essere effettuate SOLO dagli studenti frequentanti.

Il progetto viene presentato e discusso in occasione degli appelli orali. Il superamento dell'esame scritto (18/30 in ciascuna prova scritta) è condizione strettamente necessaria per presentarsi all'orale e discutere il progetto.

Fonte: ESSETRE e Portale esami