Statistical methods for the environmental research
A.A. 2024/2025
Obiettivi formativi
The course aims to complete and deepen the knowledge already acquired by students in the field of statistics during the three-year degree course, providing concepts and methodologies useful for environmental sciences, with particular attention to univariate statistics, and mentions of multivariate statistics and geostatistics.
The contents of the course will allow students to:
- improve the knowledge of univariate statistics applied to environmental analysis;
- understand which tools are available for the analysis of multivariate phenomena and for spatial analysis;
- understand the fundamental elements of statistical-probabilistic methodologies and their application in the field of spatial and environmental statistics;
- together with the Data Management course, acquire the techniques for surveying, acquiring and managing environmental data and information.
The contents of the course will allow students to:
- improve the knowledge of univariate statistics applied to environmental analysis;
- understand which tools are available for the analysis of multivariate phenomena and for spatial analysis;
- understand the fundamental elements of statistical-probabilistic methodologies and their application in the field of spatial and environmental statistics;
- together with the Data Management course, acquire the techniques for surveying, acquiring and managing environmental data and information.
Risultati apprendimento attesi
Knowledge and understanding. At the end of the course the students should know:
o univariate statistics applied to spatial analysis: multiple way ANOVA, ANCOVA and regression, with particular attention to the variable selection methods;
o the fundamental elements of multivariate statistics and geostatistics;
o the basic principles of machine learning, with particular attention to neural networks and random forest.
Applying knowledge and understanding. At the end of the course the students should be able to:
o Apply ANOVA and regression to experimental and spatial data, using statistical software;
o correctly choose the most appropriate instruments for their own analysis, based on the possibility and limits of the various approaches available;
o carry out simple multivariate or geostatistical analyses.
o univariate statistics applied to spatial analysis: multiple way ANOVA, ANCOVA and regression, with particular attention to the variable selection methods;
o the fundamental elements of multivariate statistics and geostatistics;
o the basic principles of machine learning, with particular attention to neural networks and random forest.
Applying knowledge and understanding. At the end of the course the students should be able to:
o Apply ANOVA and regression to experimental and spatial data, using statistical software;
o correctly choose the most appropriate instruments for their own analysis, based on the possibility and limits of the various approaches available;
o carry out simple multivariate or geostatistical analyses.
Periodo: Secondo semestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento può essere seguito come corso singolo.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo semestre
Programma
1) basi di statistica CFU 0.5 frontali + CFU 0.25 esercitazioni
Statistica descrittiva e distribuzioni campionarie, test statistici. Indici di tendenza centrale e di dispersione. Caratteristiche delle popolazioni e dei campioni (richiami alle principali distribuzioni di probabilità). La stima dei parametri ignoti di una popolazione partendo da campioni. Distorsione, efficienza e consistenza di uno stimatore.
2) basi di inferenza statistica CFU 0.5 frontali CFU 0.25 esercitazioni
Il test statistico: concetti di ipotesi nulla, test bilaterali e unilaterali, livello di significatività, protettività, potenza, errori di I, II e III specie. Limiti fiduciali di una media.
3) Tecniche per i confronti tra medie campionarie CFU 1.5 frontali + CFU 0.5 esercitazioni
l'analisi della varianza. Prerequisiti e condizioni di applicabilità dell'ANOVA (test di normalità e di omogeneità delle varianze). La trasformazione dei dati. L'analisi della varianza fattoriale e l'interazione: anova a 2 e 3 vie, e relativa interpretazione dei risultati. Tecniche di confronto multiplo tra medie (contrasti e test post-hoc). Cenni a tecniche non parametriche di analisi della varianza.
4) L'analisi della correlazione e della regressione CFU 1.5 frontali + CFU 0.5 esercitazioni
Il concetto di correlazione. Il coefficiente di correlazione e i relativi test statistici. L'analisi della regressione lineare. Il metodo dei minimi quadrati. Le assunzioni per la regressione e i relativi test. Il coefficiente di regressione e il suo errore standard. Test di significatività per coefficiente di regressione e intercetta. Intervalli fiduciali attorno alla retta di regressione. La regressione passante per l'origine. Il coefficiente di determinazione. L'analisi della regressione multipla. La scelta del modello ottimale (backward, forward e stepwise regression). Cenni a tecniche non parametriche per l'analisi della correlazione.
5) Introduzione all'analisi multivariata e al machine learning CFU 0.5 frontali
Cenni alle componenti principali, alla cluster analysis e alle reti neurali
Non vi sono differenze tra studenti frequentanti e non frequentanti
Statistica descrittiva e distribuzioni campionarie, test statistici. Indici di tendenza centrale e di dispersione. Caratteristiche delle popolazioni e dei campioni (richiami alle principali distribuzioni di probabilità). La stima dei parametri ignoti di una popolazione partendo da campioni. Distorsione, efficienza e consistenza di uno stimatore.
2) basi di inferenza statistica CFU 0.5 frontali CFU 0.25 esercitazioni
Il test statistico: concetti di ipotesi nulla, test bilaterali e unilaterali, livello di significatività, protettività, potenza, errori di I, II e III specie. Limiti fiduciali di una media.
3) Tecniche per i confronti tra medie campionarie CFU 1.5 frontali + CFU 0.5 esercitazioni
l'analisi della varianza. Prerequisiti e condizioni di applicabilità dell'ANOVA (test di normalità e di omogeneità delle varianze). La trasformazione dei dati. L'analisi della varianza fattoriale e l'interazione: anova a 2 e 3 vie, e relativa interpretazione dei risultati. Tecniche di confronto multiplo tra medie (contrasti e test post-hoc). Cenni a tecniche non parametriche di analisi della varianza.
4) L'analisi della correlazione e della regressione CFU 1.5 frontali + CFU 0.5 esercitazioni
Il concetto di correlazione. Il coefficiente di correlazione e i relativi test statistici. L'analisi della regressione lineare. Il metodo dei minimi quadrati. Le assunzioni per la regressione e i relativi test. Il coefficiente di regressione e il suo errore standard. Test di significatività per coefficiente di regressione e intercetta. Intervalli fiduciali attorno alla retta di regressione. La regressione passante per l'origine. Il coefficiente di determinazione. L'analisi della regressione multipla. La scelta del modello ottimale (backward, forward e stepwise regression). Cenni a tecniche non parametriche per l'analisi della correlazione.
5) Introduzione all'analisi multivariata e al machine learning CFU 0.5 frontali
Cenni alle componenti principali, alla cluster analysis e alle reti neurali
Non vi sono differenze tra studenti frequentanti e non frequentanti
Prerequisiti
Conoscenze di matematica, utilizzo foglio di calcolo Excel, elementi di base di statistica
Metodi didattici
Il corso si compone di una parte di lezioni frontali di 40 ore e di 24 ore di attività pratica al calcolatore i software statistici IBM-SPSS, oltre al foglio di calcolo Excel.
Materiale di riferimento
Il corso è erogato in lingua inglese, per cui il materiale di riferimento (slide, articoli, libri) è unicamente in lingua inglese. Tale materiale è fornito durante il corso.
There are not differences between the attending and non-attending students
There are not differences between the attending and non-attending students
Modalità di verifica dell’apprendimento e criteri di valutazione
La verifica dell'apprendimento avverrà tramite esame (on-line o in presenza) L'esame sarà svolto nell'arco di una sola giornata e si comporrà di tre parti:
1) Prova al computer di elaborazione statistica di dati assegnati. Sarà distribuito ad ogni studente un dataset in formato Excel contenente dati relativi ad esperimenti fittizi, brevemente descritti. Lo studente dovrà scegliere l'analisi statistica opportuna in base ai dati assegnati, eseguirla e commentare sinteticamente i risultati.
Durata 1 ora.
2) Prova scritta: 2 domande a risposta aperta e 5 domande a risposta chiusa. Durata 1 ora minuti.
3) Breve prova orale (massimo 10 minuti): discussione dell'elaborazione statistica, verifica delle risposte scritte e eventuali domande.
Se l'esame sarà on-line, la prova scritta e la breve prova orale sono sostituite da una prova orale di circa 30 minuti.
Non vi sono differenze tra studenti frequentanti e non frequentanti
1) Prova al computer di elaborazione statistica di dati assegnati. Sarà distribuito ad ogni studente un dataset in formato Excel contenente dati relativi ad esperimenti fittizi, brevemente descritti. Lo studente dovrà scegliere l'analisi statistica opportuna in base ai dati assegnati, eseguirla e commentare sinteticamente i risultati.
Durata 1 ora.
2) Prova scritta: 2 domande a risposta aperta e 5 domande a risposta chiusa. Durata 1 ora minuti.
3) Breve prova orale (massimo 10 minuti): discussione dell'elaborazione statistica, verifica delle risposte scritte e eventuali domande.
Se l'esame sarà on-line, la prova scritta e la breve prova orale sono sostituite da una prova orale di circa 30 minuti.
Non vi sono differenze tra studenti frequentanti e non frequentanti
AGR/02 - AGRONOMIA E COLTIVAZIONI ERBACEE - CFU: 6
Esercitazioni: 32 ore
Lezioni: 32 ore
Lezioni: 32 ore
Docente:
Acutis Marco
Turni:
Turno
Docente:
Acutis MarcoDocente/i