Analisi e modellistica predittiva dei dati
A.A. 2025/2026
Obiettivi formativi
La principale finalità del corso di Analisi e modellistica predittiva dei dati è di illustrare i principali concetti della statistica di base applicata alle scienze biomediche. Il corso integra la statistica descrittiva e inferenziale in modo da fornire agli studenti le competenze essenziali per raccogliere, analizzare, interpretare e presentare dati, facendo particolare riferimento ai dati raccolti durante il percorso di Tesi Magistrale. Nello specifico, il corso ha i seguenti obiettivi:
1. Struttura di un lavoro scientifico e ruolo dell'analisi dei da di dati e raccolta dei dati:
Rammentare agli studenti la struttura di un lavoro scientifico, sezione per sezione, ed enfatizzare il ruolo specifico giocato dall'analisi dei dati. Insegnare agli studenti le differenze tra i vari tipi di dati (qualitativi vs. quantitativi, discreti vs. continui). Introdurre metodi per la raccolta e il campionamento dei dati da una popolazione per eseguire uno studio campionario.
2. Statistica descrittiva:
Sottolineare la rilevanza della sintesi e presentazione efficace dei dati mediante tabelle e grafici (diagramma a punti, istogramma, diagramma a barre e boxplot).
Gli studenti impareranno inoltre calcolare e interpretare indicatori numerici chiave, tra cui:
-Tendenza centrale (moda, media e mediana
-Posizione (minimo, massimo, percentili)
-Dispersione (range, varianza, deviazione standard)
-Forma (asimmetria, curtosi)
3. Statistica inferenziale:
Fornire agli studenti gli strumenti per fare previsioni e inferenze su una popolazione basandosi su dati campionari. Enunciare e comprendere le implicazioni del teorema che sta al cuore della statistica inferenziale: il Teorema del Limite Centrale. Esso consente il calcolo di intervalli di confidenaz e l'esecuzuioone di test d'ipotesi. Verranno poi presentati i principali test statistici (ad esempio, Z- test t di Student per dati appaiati e dati non appaiati, ANOVA, test del chi-quadrato). L'elenco completo è enunciato nel programma delle lezioni riportato nel seguito.
4. Modellistica predittiva
Il ruolo della modellistica predittiva è di costruire dei modelli che permettano di fare previsioni. SI tratta di un ramo della statistica che sta assumendo un ruolo sempre più importante nella nostra società grazie al rapido sviluppo dell'intelligenza artificiale, e in particolare del cosiddetto machine learning. Una o più variabili (dette variabili indipendenti o predittori) vengono usate per predire una variabile (detta variabile dipendente o predetta). Partiremo dal concetto di covarianza e correlazione tra coppie di variabili per poi passare a modelli predittivi basati sulla regressione lineare semplice e multipla, sulla regressione polinomiale e sulle regressione non lineare. Nel caso della regressione non lineare, concentreremo la nostra attenzione su quattro tipi di funzioni che ricorrono frequentemente nelle scienze bniomediche: la sinusoide/cosinusoide, la funzione esponenziale, la funzione sigmoidale, la funzione saturativa secondo Michaelis-Menten.
1. Struttura di un lavoro scientifico e ruolo dell'analisi dei da di dati e raccolta dei dati:
Rammentare agli studenti la struttura di un lavoro scientifico, sezione per sezione, ed enfatizzare il ruolo specifico giocato dall'analisi dei dati. Insegnare agli studenti le differenze tra i vari tipi di dati (qualitativi vs. quantitativi, discreti vs. continui). Introdurre metodi per la raccolta e il campionamento dei dati da una popolazione per eseguire uno studio campionario.
2. Statistica descrittiva:
Sottolineare la rilevanza della sintesi e presentazione efficace dei dati mediante tabelle e grafici (diagramma a punti, istogramma, diagramma a barre e boxplot).
Gli studenti impareranno inoltre calcolare e interpretare indicatori numerici chiave, tra cui:
-Tendenza centrale (moda, media e mediana
-Posizione (minimo, massimo, percentili)
-Dispersione (range, varianza, deviazione standard)
-Forma (asimmetria, curtosi)
3. Statistica inferenziale:
Fornire agli studenti gli strumenti per fare previsioni e inferenze su una popolazione basandosi su dati campionari. Enunciare e comprendere le implicazioni del teorema che sta al cuore della statistica inferenziale: il Teorema del Limite Centrale. Esso consente il calcolo di intervalli di confidenaz e l'esecuzuioone di test d'ipotesi. Verranno poi presentati i principali test statistici (ad esempio, Z- test t di Student per dati appaiati e dati non appaiati, ANOVA, test del chi-quadrato). L'elenco completo è enunciato nel programma delle lezioni riportato nel seguito.
4. Modellistica predittiva
Il ruolo della modellistica predittiva è di costruire dei modelli che permettano di fare previsioni. SI tratta di un ramo della statistica che sta assumendo un ruolo sempre più importante nella nostra società grazie al rapido sviluppo dell'intelligenza artificiale, e in particolare del cosiddetto machine learning. Una o più variabili (dette variabili indipendenti o predittori) vengono usate per predire una variabile (detta variabile dipendente o predetta). Partiremo dal concetto di covarianza e correlazione tra coppie di variabili per poi passare a modelli predittivi basati sulla regressione lineare semplice e multipla, sulla regressione polinomiale e sulle regressione non lineare. Nel caso della regressione non lineare, concentreremo la nostra attenzione su quattro tipi di funzioni che ricorrono frequentemente nelle scienze bniomediche: la sinusoide/cosinusoide, la funzione esponenziale, la funzione sigmoidale, la funzione saturativa secondo Michaelis-Menten.
Risultati apprendimento attesi
Alla fine del corso, lo studente sarà in grado di meglio interpretare i risultati forniti dalle procedure statistica usate nella letteratura biomedica. Inoltre, sarà stata acquisita la capacità di scegliere le tecniche statistiche più appropriate per analizzare i dati sperimentali raccolti nel corso della propria Tesi di Laurea Magistrale. Nello specifico, i risultati e i benefici attesi per gli studenti saranno:
1. Miglioramento del pensiero analitico
Gli studenti acquisiranno familiarità con l'analisi statistica dei dati e saranno in grado di identificare schemi, tendenze e valori anomali.
2. Competenza nelle tecniche statistiche
Acquisiranno competenze pratiche sia nella statistica descrittiva che inferenziale,
consentendo loro di analizzare set di dati, eseguire test stastistici e trarre conclusioni razionali.
3. Capacità di prendere decisioni basate sui dati
Impareranno a prendere decisioni informate basate sull'analisi statistica, abilità sempre più importante in un mondo in cui i dati sono considerati il "nuovo petrolio".
4. Sviluppo delle capacità di problem-solving
Attraverso l'applicazione di vari metodi statistici, svilupperanno la capacità di affrontare
problemi complessi e trarre conclusioni valide dai dati.
5. Preparazione per la preparazione ad una carriera accademica
Il corso fornirà una base solida per gli studenti che volessero perseguire un dottorato di ricerca.
6. Sviluppo delle competenze nella presentazione dei dati
Saranno in grado di presentare i dati in modo efficace utilizzando grafici, tabelle e report che
comunicano informazioni complesse in modo comprensibile ed efficace.
1. Miglioramento del pensiero analitico
Gli studenti acquisiranno familiarità con l'analisi statistica dei dati e saranno in grado di identificare schemi, tendenze e valori anomali.
2. Competenza nelle tecniche statistiche
Acquisiranno competenze pratiche sia nella statistica descrittiva che inferenziale,
consentendo loro di analizzare set di dati, eseguire test stastistici e trarre conclusioni razionali.
3. Capacità di prendere decisioni basate sui dati
Impareranno a prendere decisioni informate basate sull'analisi statistica, abilità sempre più importante in un mondo in cui i dati sono considerati il "nuovo petrolio".
4. Sviluppo delle capacità di problem-solving
Attraverso l'applicazione di vari metodi statistici, svilupperanno la capacità di affrontare
problemi complessi e trarre conclusioni valide dai dati.
5. Preparazione per la preparazione ad una carriera accademica
Il corso fornirà una base solida per gli studenti che volessero perseguire un dottorato di ricerca.
6. Sviluppo delle competenze nella presentazione dei dati
Saranno in grado di presentare i dati in modo efficace utilizzando grafici, tabelle e report che
comunicano informazioni complesse in modo comprensibile ed efficace.
Periodo: Primo semestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Primo semestre
ING-INF/06 - BIOINGEGNERIA ELETTRONICA E INFORMATICA - CFU: 2
MAT/06 - PROBABILITA' E STATISTICA MATEMATICA - CFU: 4
MAT/06 - PROBABILITA' E STATISTICA MATEMATICA - CFU: 4
Lezioni: 48 ore
Docente:
Caumo Andrea
Docente/i