Probability and statistics
A.A. 2024/2025
Obiettivi formativi
The goal of the course is to provide notions of descriptive statistics, probability theory and statistical inference that constitute the foundation of applied research in economics. The aim is to develop the proper technical language and to enable students to attend more specialized courses such as "Econometrics" and "Machine Learning for Economics".
Risultati apprendimento attesi
At the end of the course, the student will have acquired the main tools related to descriptive statistics (construction of indices, tables and graphs and interpretation of the same), probability theory (Bayes theorem, probability distribution and random variables) and statistical inference (point estimation, confidence intervals and hypothesis testing).
Students will be able to apply the studied statistical techniques to analyse data and solve common real-life problems. They will be able to interpret the most common statistical indices; calculate and interpret point estimates, and confidence intervals and test the most common statistical hypothesis, such as equality of means and independence between variables. Moreover, they will be able to perform a simple linear regression and interpret the output through statistical software.
Students will be able to apply the studied statistical techniques to analyse data and solve common real-life problems. They will be able to interpret the most common statistical indices; calculate and interpret point estimates, and confidence intervals and test the most common statistical hypothesis, such as equality of means and independence between variables. Moreover, they will be able to perform a simple linear regression and interpret the output through statistical software.
Periodo: Secondo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento può essere seguito come corso singolo.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo trimestre
Programma
Statistiche descrittive
1) Calcolo della moda, mediana, media quando i dati sono classificati in tabelle di frequenza. Proprietà della media
2) Variabilità e indici di dispersione come il rango, la differenza interquartile, varianza e deviazione standard
3) Tabelle di contigenza e analisi bivariata. Definizione di distribuzioni di frequenze marginali, condizionate, indice di Pearson per l'indipendenza, coefficiente di covarianza e correlazione
Probabilità e variabili casuali:
1) Introduzione alla teoria di probabilità: classica, definizione delle probabilità frequentiste, eventi disgiunti, teorema di Bayes, principio delle probabilità totali
2) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, density, media attesa e varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali (esempi di variabili casuali come la Bernoulli, Binomiale e normale)
3) Teorema del limite centrale e legge dei grandi numeri.
Inferenza Statistica
1) Stima puntuale: definizione di stimatore corretto e errori standard. Funzione di verosimiglianza e stimatore di massima verosimiglianza
2) Intervalli di confidenza per la media e la popolazione
3) Test di ipotesi: ipotesi nulla vs alternativa, errori del primo e del secondo tipo; p-value e regione di rifiuto, t-test per la comparazione tra due medie; test di ANOVA per la comparazione con medie multiple
4) Definizione di regressione lineare: Stima dei paramtetri (intercetta e pendenza della retta) con il metodo dei quadrati ordinari; test di ipotesi sui coefficienti con applicazioni e bontà del modello
1) Calcolo della moda, mediana, media quando i dati sono classificati in tabelle di frequenza. Proprietà della media
2) Variabilità e indici di dispersione come il rango, la differenza interquartile, varianza e deviazione standard
3) Tabelle di contigenza e analisi bivariata. Definizione di distribuzioni di frequenze marginali, condizionate, indice di Pearson per l'indipendenza, coefficiente di covarianza e correlazione
Probabilità e variabili casuali:
1) Introduzione alla teoria di probabilità: classica, definizione delle probabilità frequentiste, eventi disgiunti, teorema di Bayes, principio delle probabilità totali
2) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, density, media attesa e varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali (esempi di variabili casuali come la Bernoulli, Binomiale e normale)
3) Teorema del limite centrale e legge dei grandi numeri.
Inferenza Statistica
1) Stima puntuale: definizione di stimatore corretto e errori standard. Funzione di verosimiglianza e stimatore di massima verosimiglianza
2) Intervalli di confidenza per la media e la popolazione
3) Test di ipotesi: ipotesi nulla vs alternativa, errori del primo e del secondo tipo; p-value e regione di rifiuto, t-test per la comparazione tra due medie; test di ANOVA per la comparazione con medie multiple
4) Definizione di regressione lineare: Stima dei paramtetri (intercetta e pendenza della retta) con il metodo dei quadrati ordinari; test di ipotesi sui coefficienti con applicazioni e bontà del modello
Prerequisiti
Al fine di affrontare adeguatamente i contenuti proposti nel corso, gli studenti dovranno aver maturato adeguate competenze in ambito matematico e competenze di base in ambito di programmazione.
Metodi didattici
Il corso sarà organizzato attraverso lezioni teoriche e pratiche. Il materiale sarà reso disponibile su Ariel
Materiale di riferimento
-) Abadir, K. M., Heijmans, R. D., Magnus, J. R. (2018) "Statistics" (Editor Cambridge)
-) Agresti, A., Kateri, M. (2021) "Foundations of Statistics for Data Scientists: With R and Python" (Editor Taylor and Francis Ltd)
-) Gelman, A., Hill, J. and Vehtari, A. (2020). "Regression and other stories" (Editor Cambridge)
-) Agresti, A., Kateri, M. (2021) "Foundations of Statistics for Data Scientists: With R and Python" (Editor Taylor and Francis Ltd)
-) Gelman, A., Hill, J. and Vehtari, A. (2020). "Regression and other stories" (Editor Cambridge)
Modalità di verifica dell’apprendimento e criteri di valutazione
Esame scritto finale (libro chiuso) della durata di 90 minuti. L'esame consiste di 3 esercizi e di domande a risposta multipla (valutate da 0 a 30 punti) che copriranno tutti gli argomenti presenti nel programma
Siti didattici
Docente/i
Ricevimento:
Ogni Mercoledì 12-14
DEMM, stanza 31, 3° p (Previa Appuntamento inviando una mail)