Bioinformatics

A.A. 2021/2022
6
Crediti massimi
48
Ore totali
SSD
INF/01
Lingua
Inglese
Obiettivi formativi
L'insegnamento si propone di:
- Fornire allo studente le conoscenze fondamentali per l'analisi di dati complessi in ambito biologico e medico con metodi di Apprendimento Automatico.
- Introdurre lo studente alle metodologie computazionali allo stato dell'arte per estrarre conoscenza biologica e medica da collezioni, anche massive, di dati o osservazioni o in presenza di informazione incerta, e per creare modelli predittivi per applicazioni fondamentali in ambito bio-medico.
- Fornire gli strumenti metodologici fondamentali per intraprendere in maniera autonoma attività di approfondimento e ricerca scientifica secondo standard internazionali nell'area della Bioinformatica e della Biologia Computazionale.
Risultati apprendimento attesi
- Capacità di applicare le principali metodologie di Apprendimento Automatico per l'analisi dei dati bio-molecolari rivolte sia all'estrazione di conoscenza, sia alla costruzioni di modelli predittivi nell'ambito della Biologia Molecolare e della Medicina Personalizzata.
- Comprensione delle problematiche legate al trattamento di dati su larga scala in ambito biologico e medico.
- Capacità di applicare ed adattare modelli di Apprendimento Automatico sviluppati in diversi ambiti applicativi nel contesto della Bioinformatica e della Biologia Computazionale
- Capacità di ragionare criticamente e di porre in discussione scelte progettuali e implementative.
Tali capacità verranno valutate attraverso
una relazione relativa ad un progetto software ed una discussione orale sui contenuti del corso.
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo semestre
- Metodi didattici:
Le lezioni si svolgeranno in remoto con modalità sincrona utilizzando la piattaforma Zoom, nel caso in cui le autorità preposte suggeriscano tale modalità di erogazione dell'insegnamento, altrimenti verranno erogate in presenza.
Tutte le informazioni per partecipare alla lezioni tramite Zoom saranno disponibibili sul sito Ariel dell'insegnamento, in modo analogo al precedente anno accademico.
L'insegnamento prevede sia lezioni frontali, sia lezioni di laboratorio sw per l'implementazione e l'applicazione di metodi di Machine Learning all'analisi di dati bio-medici. Tutte le slide ed i materiali didattici utilizzati per le lezioni frontali e gli script ed i programmi di esempio per il laboratorio sw sono disponibili sul sito Ariel dell'insegnamento.
- Materiali di riferimento:
Il programma e il materiale di riferimento non subiranno variazioni rispetto all'anno accademico precedente, a parte alcuni aggiornamenti del modulo sulla Network Medicine, i cui materiali didattici aggiornati saranno presenti sul sito Ariel dell'insegnamento.
- Modalità di verifica dell'apprendimento e criteri di valutazione:
L'esame si svolgerà in remoto tramite piattaforma Zoom e si articola in due parti:
a) discussione di un progetto sw relativo agli argomenti dell'insegnamento oppure discussione di un articolo scientifico concordato con il docente.
b) verifica orale delle conoscenze relative agli argomenti dell'insegnamento.
La valutazione complessiva della prova considererà il grado di conoscenza degli argomenti, capacità di applicare metodi computazionali alla risoluzione di problemi reali nell'ambito della biologia e della medicina, capacità di ragionamento critico, chiarezza espositiva e proprietà di linguaggio.

Programma
L'insegnamento fornisce strumenti metodologici per affrontare problemi rilevanti nell'ambito della biologia Molecolare e della Medicina con algoritmi e tecniche di Machine Learning.
L'insegnamento si articola in due parti principali: a) Introduzione ai metodi di Machine Learning: b) Metodi di Machine Learning per la Biologia Computazionale.
Nella prima parte (Introduzione ai metodi di Machine Learning) vengono introdotti:
a) i concetti fondamentali di apprendimento supervisionato, semi-supervisionato e non supervisionato con alcun esempi di metodi di Machine Learning per ciascuna tipologia di apprendimento automatico
b) le tecniche sperimentali per la stima dell' errore di generalizzazione dei sistemi di Apprendimento Automatico.
Nella seconda parte (Metodi di Machine Learning per la Biologia Computazionale) viene fornito un quadro generale delle applicazioni dei metodi di Machine Learning in Biologia Computazionale ed in particolare vengono trattati i seguenti problemi, con un focus particolare sulle metodologie di apprendimento utilizzate:
a) ll problema della predizione supervisionata della funzione delle proteine
b) Problemi di Biologia Computazionale basati sull'analisi semi-supervisionata di grafi
c) Problemi di apprendimento supervisionato per la Genomica Medica
Per ognuno dei problemi di Biologia Computazionale affrontati, vengono fornite le conoscenze biologiche necessarie per modellare i problemi bio-medici affrontati come problemi di Machine Learning.
Prerequisiti
Nozioni di analisi matematica e statistica, appresi nei corsi del triennio di Informatica (o in corsi equivalenti a Matematica del Continuo e Matematica del Discreto per studenti provenienti da altre lauree triennali).
Insegnamenti consigliati (ma non obbligatori): Statistical Methods for Machine Learning and Artificial Intelligence (corso di laurea in Informatica)
Metodi didattici
Le lezioni sono svolte frontalmente o sotto forma di discussione con gli studenti riguardo a materiale didattico ed articoli precedentemente indicati. Sono previsti anche lavori di gruppo per lo svolgimento di progetti software relativi ad argomenti del'insegnamento.
Materiale di riferimento
Bibliografia e materiale didattico relativo all'insegnamento (slide, articoli scientifici, libri) sono disponibili sul sito Ariel dell'insegnamento stesso:
https://gvalentinib.ariel.ctu.unimi.it/
Modalità di verifica dell’apprendimento e criteri di valutazione
Modalità d'esame:
Si articola in 2 parti:
I. Svolgimento di un progetto software oppure discussione orale di letteratura scientifica, relativi ad un argomento trattato nel corso dell'insegnamento. Il progetto software richiede, oltre alla scrittura del codice per l'analisi di dati genomici, la redazione di un report che descriva il problema affrontato, i metodi di Machine Learning utilizzati, il set-up sperimentale, i risultati ottenuti ed una beve discussione sui risultati, delineando i vantaggi e le limitazioni dell'approccio proposto. La discussione orale della letteratura scientifica ha lo scopo di verificare che lo studente abbia compreso il contenuto scientifico e che sia in grado di evidenziare gli aspetti problematici e critici del lavoro studiato.
II. Discussione orale sugli argomenti trattati durante il corso dell'insegnamento.
Al termine della prova orale viene formulata la valutazione complessiva, espressa in trentesimi, tenendo conto dei seguenti fattori: grado di conoscenza degli argomenti, capacità di applicare le conoscenze acquisite alla risoluzione di problemi concreti, capacità di ragionamento critico, chiarezza espositiva e proprietà di linguaggio.
INF/01 - INFORMATICA - CFU: 6
Lezioni: 48 ore
Docente/i
Ricevimento:
Per appuntamento tramite e-mail
Diparitmento Informatica, via Celoria 18, stanza 3011