Statistical methods for machine learning

A.A. 2024/2025
6
Crediti massimi
48
Ore totali
SSD
INF/01
Lingua
Inglese
Obiettivi formativi
L'insegnamento descrive e analizza, in un contesto statistico rigoroso, alcune delle più importanti tecniche per il progetto e analisi di algoritmi di apprendimento automatico.
Risultati apprendimento attesi
Al termine dell'insegnamento gli studenti saranno in grado di comprendere il concetto di overfitting e il suo ruolo nel controllo del rischio statistico, descrivere alcuni algoritmi fondamentali di apprendimento automatico spiegando come evitano l'overfitting, eseguire esperimenti di apprendimento automatico usando la corretta metodologia statistica. Questi obiettivi verranno misurati attraverso la relazione del progetto e la prova scritta. Il voto finale è ottenuto combinando la valutazione del progetto con la valutazione della prova scritta.
Corso singolo

Questo insegnamento può essere seguito come corso singolo.

Programma e organizzazione didattica

Edizione unica

Periodo
Secondo semestre

Programma
Introduzione
L'algoritmo Nearest Neighbour
Predittori ad albero
Apprendimento statistico
Stima degli iperparametri e cross-validazione
Analisi del rischio dei predittori ad albero
Consistenza e algoritmi non parametrici
Predittori lineari
Discesa del gradiente sequenziale
Funzioni kernel
Support Vector Machines
Analisi di stabilità e controllo del rischio in SVM
Boosting e metodi ensemble
Reti neuronali e apprendimento profondo
Regressione logistica e funzioni di perdita surrogate
Prerequisiti
Si richiedono nozioni di base di analisi matematica, algebra lineare, probabilità e statistica.

E` fortemente consigliato il superamento dei seguenti esami: Matematica del continuo, Matematica del discreto, Statistica e analisi dei dati.
Metodi didattici
Lezioni frontali.
Materiale di riferimento
Il riferimento principale sono le dispense disponibili presso ncesa-bianchismml.ariel.ctu.unimi.it/

Libro di testo di riferimento: Shai Shalev-Shwartz e Shai Ben-David, Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press, 2014.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame consiste nella scrittura di una relazione di circa 10-15 pagine contenente la descrizione di un'attività sperimentale (progetto sperimentale) o un'analisi approfondita di un risultato teorico (progetto teorico). Il voto finale (in trentesimi) è ottenuto combinando la valutazione del progetto con il risultato di una prova scritta riguardante il programma svolto a lezione.
INF/01 - INFORMATICA - CFU: 6
Lezioni: 48 ore
Turni:
Docente/i
Ricevimento:
Su appuntamento
via Celoria 18. Stanza 7007