Statistical methods for machine learning
A.A. 2024/2025
Obiettivi formativi
L'insegnamento descrive e analizza, in un contesto statistico rigoroso, alcune delle più importanti tecniche per il progetto e analisi di algoritmi di apprendimento automatico.
Risultati apprendimento attesi
Al termine dell'insegnamento gli studenti saranno in grado di comprendere il concetto di overfitting e il suo ruolo nel controllo del rischio statistico, descrivere alcuni algoritmi fondamentali di apprendimento automatico spiegando come evitano l'overfitting, eseguire esperimenti di apprendimento automatico usando la corretta metodologia statistica. Questi obiettivi verranno misurati attraverso la relazione del progetto e la prova scritta. Il voto finale è ottenuto combinando la valutazione del progetto con la valutazione della prova scritta.
Periodo: Secondo semestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento può essere seguito come corso singolo.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo semestre
Programma
Introduzione
L'algoritmo Nearest Neighbour
Predittori ad albero
Apprendimento statistico
Stima degli iperparametri e cross-validazione
Analisi del rischio dei predittori ad albero
Consistenza e algoritmi non parametrici
Predittori lineari
Discesa del gradiente sequenziale
Funzioni kernel
Support Vector Machines
Analisi di stabilità e controllo del rischio in SVM
Boosting e metodi ensemble
Reti neuronali e apprendimento profondo
Regressione logistica e funzioni di perdita surrogate
L'algoritmo Nearest Neighbour
Predittori ad albero
Apprendimento statistico
Stima degli iperparametri e cross-validazione
Analisi del rischio dei predittori ad albero
Consistenza e algoritmi non parametrici
Predittori lineari
Discesa del gradiente sequenziale
Funzioni kernel
Support Vector Machines
Analisi di stabilità e controllo del rischio in SVM
Boosting e metodi ensemble
Reti neuronali e apprendimento profondo
Regressione logistica e funzioni di perdita surrogate
Prerequisiti
Si richiedono nozioni di base di analisi matematica, algebra lineare, probabilità e statistica.
E` fortemente consigliato il superamento dei seguenti esami: Matematica del continuo, Matematica del discreto, Statistica e analisi dei dati.
E` fortemente consigliato il superamento dei seguenti esami: Matematica del continuo, Matematica del discreto, Statistica e analisi dei dati.
Metodi didattici
Lezioni frontali.
Materiale di riferimento
Il riferimento principale sono le dispense disponibili presso ncesa-bianchismml.ariel.ctu.unimi.it/
Libro di testo di riferimento: Shai Shalev-Shwartz e Shai Ben-David, Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press, 2014.
Libro di testo di riferimento: Shai Shalev-Shwartz e Shai Ben-David, Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press, 2014.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame consiste nella scrittura di una relazione di circa 10-15 pagine contenente la descrizione di un'attività sperimentale (progetto sperimentale) o un'analisi approfondita di un risultato teorico (progetto teorico). Il voto finale (in trentesimi) è ottenuto combinando la valutazione del progetto con il risultato di una prova scritta riguardante il programma svolto a lezione.
INF/01 - INFORMATICA - CFU: 6
Lezioni: 48 ore
Docente:
Cesa Bianchi Nicolo' Antonio
Turni:
Turno
Docente:
Cesa Bianchi Nicolo' AntonioDocente/i