Analisi dei dati per l'agricoltura

A.A. 2024/2025
6
Crediti massimi
64
Ore totali
SSD
AGR/17
Lingua
Italiano
Obiettivi formativi
Fornire le basi metodologiche e pratiche per una rigorosa gestione dei dati quantitativi in agricoltura, la progettazione di indagini campionarie, rilievi di campo e prove sperimentali in agricoltura.
Sviluppare capacità avanzate di utilizzo di fogli di calcolo e di software dedicati per la raccolta e per l'analisi statistica della sempre più rilevante massa di dati, gestionali e biologici, in agricoltura.
Fornire solide basi teoriche e pratiche per la lettura, analisi, interpretazione e presentazione dei dati provenienti da database del settore, indagini campionarie, misure di campo e risultati di prove sperimentali.
Risultati apprendimento attesi
Capacità di gestire dati provenienti da database nazionali ed internazionali di settore, e/o da rilievi campionari in agricoltura.
Capacità di svolgere analisi descrittive grafiche e quantitative, di analizzare trend, fattori di variazione e fattori di confondimento mediante l'utilizzo delle opportune tecniche grafiche e statistiche con fogli di calcolo e software di elaborazione statistica.
Capacità di presentare, leggere ed interpretare i dati provenienti sia dal campo sia dal laboratorio.
Corso singolo

Questo insegnamento può essere seguito come corso singolo.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Primo semestre

Programma
Il programma in breve:
Il corso, dopo un richiamo dei concetti di base di statistica descrittiva affronta le principali tecniche di analisi dei dati utili per la valutazione delle informazioni quantitative e qualitative in agricoltura.
Le lezioni si articoleranno in una parte teorica ed una parte applicativa in aula di informatica.
In breve il corso affronterà: descrizione e rappresentazione di dati qualitativi e quantitativi provenienti da database nazionali ed internazionali. Rappresentazione grafiche, analisi dei trend e degli outlier. Distribuzioni campionarie e teoriche. Relazione fra variabili quantitative: covarianza, correlazione e regressione. Relazioni fra variabili quantitative. Normalizzazione e standardizzazione. Test delle ipotesi e test statistici per dati quantitativi e qualitativi. Analisi della varianza ad una e più vie. Fattori di confondimento, interazione, fattori fissi e casuali. Regressione lineare semplice e multipla, Disegno degli esperimenti e schemi sperimentali. Cenni di test non parametrici e di tecniche di analisi multivariata.

Il programma in dettaglio:

Creazione, gestione e preparazione di dataset quantitativi. 4 h
Richiami di statistica descrittiva: Rappresentazione grafica dei dati: istogrammi, diagrammi box plot, scatter plot 4h
Indici di posizione e dispersione 4h
Misure di relazione fra variabili: covarianza. L'analisi della correlazione e della regressione lineare. Il metodo dei minimi quadrati per la stima dei parametri.4h

Caratteristiche delle popolazioni e dei campioni. Stima dei parametri di una popolazione: stima puntuale ed intervallare. Distorsione, efficienza e consistenza di uno stimatore. Il test statistico: concetti di ipotesi nulla, test bilaterali e unilaterali, livello di significatività e sua valutazione critica, errori di I e II tipo, potenza del test. 3 h

Distribuzioni campionarie e distribuzioni teoriche: binomiale, Poisson, normale, normale standardizzata, log-normale. 6h

Variabili qualitative: loro rappresentazione grafica e test di significatività. Test chi quadrato per la valutazione della bontà di adattamento di dati osservati a distribuzioni teoriche (equiprobabile, binomiale, Poisson) e per la verifica di ipotesi di indipendenza di variabili qualitative. Correzione di Yates. 6h

Test su una media. Z score. intervalli di confidenza, t test. Tecniche per i confronti tra due medie campionarie. Il test t per dati appaiati e per campioni indipendenti. Assunzioni. Problematiche dei confronti indiretti. 6 h

Tecniche di confronto fra più medie: l'analisi della varianza. Assunzioni dell'ANOVA (test di normalità e di omogeneità delle varianze). L'analisi della varianza fattoriale e l'interazione: ANOVA a 2 e 3 vie, e relativa interpretazione dei risultati. ANCOVA 6 h
L'analisi gerarchica della varianza. Modello lineare generale. Modello a fattori fissi e modello a fattori casuali. Tecniche di confronto multiplo tra medie (contrasti e test post-hoc). 4 h

L'analisi della varianza della regressione. Bontà del modello. Le assunzioni per la regressione e i relativi test. Il coefficiente di regressione e il suo errore standard. Valori previsti e residui, analisi dei residui. Analisi degli outlier. Test di significatività per coefficiente di regressione e intercetta. Intervalli fiduciali attorno alla retta di regressione. Il coefficiente di determinazione. Significatività statistica della correlazione e della regressione. 4h

Cenni alla trasformazione dei dati, al ranking e ai test non parametrici. 2h

Cenni di analisi della regressione multipla La scelta del modello ottimale (backward, forward e stepwise regression). 2h

Disegno degli esperimenti: stima della dimensione degli esperimenti e della dimensione dell'effetto. Gli schemi sperimentali: blocchi randomizzati, quadrato latino, split-plot. 2 h
Introduzione all'analisi multivariata: 2h
Esecuzione, lettura ed interpretazione dei risultati dei diversi metodi con software statistici dedicati. 9h
Prerequisiti
Conoscenze di base di statistica descrittiva. Capacità di utilizzo di fogli di calcolo elettronico.
I prerequisiti per gli studenti e le studentesse non frequentanti sono gli stessi degli studenti/studentesse frequentanti.
Metodi didattici
Il corso è organizzato in lezioni frontali 3,5 CFU (28 h)ed esercitazioni pratiche in aula di informatica 2,5 CFU (28 h). Ogni lezione è articolata in una parte teorica ed una parte applicata. Una assidua frequenza alle lezioni e alle esercitazioni è fortemente consigliata. La modalità interattiva del corso permetterà infatti agli studenti e alle studentesse di comprendere meglio le aree di applicazioni delle diverse tematiche affrontate nel corso.
Materiale di riferimento
Verranno messe a disposizione degli studenti e delle studentesse sul sito MyAriel del corso (https://pcrepaldimsa.ariel.ctu.unimi.it/v5/home/Default.aspx) le slide delle lezioni e il materiale di supporto al corso: dataset di analisi, link ad articoli scientifici e a pagine web di interesse. Durante il corso e nelle slide della prima lezione verranno indicati i testi di riferimento.
Modalità di verifica dell’apprendimento e criteri di valutazione
La verifica dell'apprendimento consiste in una prova scritta e pratica seguita da un colloquio orale facoltativo. Lo scritto consiste in 6 domande: di cui una a risposta multipla, due a risposta aperta, 2 esercizi e un output di un programma statistico da commentare. La prova pratica consiste nell'analisi di un dataset
La prova scritta vede la valutazione delle 6 domande in funzione del linguaggio scientifico- tecnico adottato, della completezza e dello spirito critico di commento ai risultati. La prova scritta può raggiungere un punteggio massimo pari a 24 (fino a 4 punti per ogni domanda).
La prova pratica è volta ad accertare che il candidato sappia scegliere il metodo di analisi corretto, sappia utilizzare un software statistico per l'esecuzione dell'analisi e sappia commentarne i risultati. Questa prova verrà valutata con un punteggio massimo di 6 punti.
Le due prove hanno una durata di 45 minuti ciascuna e vengono svolte una di seguito all'altra.
Se il/la candidato/a non arriva alla sufficienza (18/30 ) nella prova scritta, la prova pratica non viene valutata.
Il colloquio orale verte sui risultati delle prove scritta e pratica e viene svolto a seguito del superamento della prova scritta e pratica. I l colloquio è volto al chiarimento degli errori presenti nella prova per il miglioramento del voto.

Le modalità di verifica dell'apprendimento per gli/le studenti/studentesse non frequentanti sono le stesse degli studenti/studentesse frequentanti.

Studentesse e studenti con DSA o disabilità sono pregate/i di contattare via mail il docente almeno15 giorni prima della data di esame prevista per concordare le eventuali misure individualizzate. Nella mail indirizzata al docente è necessario mettere in CC i rispettivi Servizi di Ateneo: [email protected] (per studenti con DSA) o [email protected] (per studenti con disabilità).
AGR/17 - ZOOTECNICA GENERALE E MIGLIORAMENTO GENETICO - CFU: 6
Esercitazioni in aula informatica: 32 ore
Lezioni: 32 ore
Docente: Crepaldi Paola
Turni:
Turno
Docente: Crepaldi Paola
Docente/i
Ricevimento:
Su appuntamento richiesto tramite messaggio e-mail
Sezione di Zootecnica Agraria, I piano, via Celoria 2