Statistica
A.A. 2024/2025
Obiettivi formativi
L'obiettivo dell'insegnamento di "Statistica" è fornire le nozioni di base di statistica descrittiva, probabilità e statistica inferenziale in modo da acquisire la terminologia adeguata e poter affrontare insegnamenti di statistica più specifici e avanzati, quali "Statistica per le decisioni aziendali", "Statistica per i Big Data Economico/Aziendali" ed "Econometria".
Risultati apprendimento attesi
Al termine dell'insegnamento lo studente avrà acquisito la terminologia adeguata e avrà appreso i principali strumenti di statistica descrittiva (costruzione di indici, tabelle e grafici e interpretazione degli stessi) e di statistica inferenziale (stima puntuale, intervalli di confidenza e verifica d'ipotesi).
In particolare sarà in grado di individuare gli strumenti più appropriati per affrontare i problemi pratici più comuni attraverso l'analisi dei dati. Saprà costruire e leggere tabelle di frequenza e interpretare i principali indicatori statistici; calcolare e interpretare stime puntuali e intervallari e risolvere i più comuni problemi di verifica d'ipotesi, quali il confronto tra medie e la verifica d'indipendenza tra variabili. Infine sarà in grado di svolgere una regressione lineare semplice con un software statistico e di interpretarne l'output.
In particolare sarà in grado di individuare gli strumenti più appropriati per affrontare i problemi pratici più comuni attraverso l'analisi dei dati. Saprà costruire e leggere tabelle di frequenza e interpretare i principali indicatori statistici; calcolare e interpretare stime puntuali e intervallari e risolvere i più comuni problemi di verifica d'ipotesi, quali il confronto tra medie e la verifica d'indipendenza tra variabili. Infine sarà in grado di svolgere una regressione lineare semplice con un software statistico e di interpretarne l'output.
Periodo: Primo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento può essere seguito come corso singolo.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Primo trimestre
Programma
Statistica descrittiva
1) Classificazione dei fenomeni statistici (tipi di caratteri e scale di modalità) e distribuzioni di frequenza (frequenze assolute, relative e cumulate).
2) Rappresentazioni grafiche: grafico a barre, grafico a bastoncini, istogramma di frequenze.
3) Calcolo di: moda, mediana e media campionarie quando i dati sono classificati in una tabella. Teoremi e proprietà della media.
4) Alcuni indici di variabilità e dispersione: campo di variazione, differenza e scarto interquartile, varianza e scarto quadratico medio. Il coefficiente di variazione.
5) Tabelle di contingenza e analisi bivariata: definizione di distribuzioni di frequenza congiunte assolute e relative, marginali e condizionate; l'indice di Pearson per l'indipendenza; la dipendenza in media; la covarianza e il coefficiente di correlazione lineare.
Probabilità e variabili casuali
1) Introduzione al calcolo delle probabilità: impostazioni della probabilità (classica, frequentista, soggettivista, assiomatica), eventi elementari, composti e incompatibili, principio delle probabilità composte, indipendenza stocastica, principio delle probabilità totali, tipologie di campionamento (estrazioni con e senza reinserimento tenendo conto o meno dell'ordine).
2) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, densità di probabilità, funzione di ripartizione; valore atteso (o media), moda, mediana, varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali.
3) Cenni al teorema del limite centrale e alla legge dei grandi numeri.
4) Le variabili casuali di Bernoulli, Normale e Binomiale; approssimazione Normale alla Binomiale.
Statistica inferenziale
1) La stima puntuale: definizione di stimatore non distorto; l'errore standard come misura di precisione di uno stimatore. La media e la varianza campionarie; la proporzione campionaria.
Funzione di verosimiglianza. Stimatori di massima verosimiglianza e loro proprietà. Esempi.
2) Intervalli di confidenza per una media (con osservazioni Normali e varianza nota o ignota). Intervalli di confidenza per una proporzione.
3) Definizione generale del problema della verifica d'ipotesi e di p-value. Verifica d'ipotesi per una media, con osservazioni Normali e varianza nota o ignota; il test t-per il confronto tra 2 medie; il test ANOVA per il confronto tra più medie.
4) Verifica d'ipotesi per una proporzione. Test del chi-quadrato per il confronto tra più proporzioni e per verificare l'indipendenza tra due variabili.
La regressione lineare semplice
1) Presentazione del pacchetto statistico R: come si installa; comandi fondamentali.
2) Definizione di modello di regressione lineare; stima dei parametri (coefficiente angolare e intercetta) col metodo dei minimi quadrati; bontà di adattamento e coefficiente di determinazione; intervallo di confidenza per i coefficienti della retta di regressione; verifica d'ipotesi sull'intercetta e sul coefficiente angolare.
3) L'uso di R per le analisi statistiche descritte al punto 2. Interpretazione dell'output.
1) Classificazione dei fenomeni statistici (tipi di caratteri e scale di modalità) e distribuzioni di frequenza (frequenze assolute, relative e cumulate).
2) Rappresentazioni grafiche: grafico a barre, grafico a bastoncini, istogramma di frequenze.
3) Calcolo di: moda, mediana e media campionarie quando i dati sono classificati in una tabella. Teoremi e proprietà della media.
4) Alcuni indici di variabilità e dispersione: campo di variazione, differenza e scarto interquartile, varianza e scarto quadratico medio. Il coefficiente di variazione.
5) Tabelle di contingenza e analisi bivariata: definizione di distribuzioni di frequenza congiunte assolute e relative, marginali e condizionate; l'indice di Pearson per l'indipendenza; la dipendenza in media; la covarianza e il coefficiente di correlazione lineare.
Probabilità e variabili casuali
1) Introduzione al calcolo delle probabilità: impostazioni della probabilità (classica, frequentista, soggettivista, assiomatica), eventi elementari, composti e incompatibili, principio delle probabilità composte, indipendenza stocastica, principio delle probabilità totali, tipologie di campionamento (estrazioni con e senza reinserimento tenendo conto o meno dell'ordine).
2) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, densità di probabilità, funzione di ripartizione; valore atteso (o media), moda, mediana, varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali.
3) Cenni al teorema del limite centrale e alla legge dei grandi numeri.
4) Le variabili casuali di Bernoulli, Normale e Binomiale; approssimazione Normale alla Binomiale.
Statistica inferenziale
1) La stima puntuale: definizione di stimatore non distorto; l'errore standard come misura di precisione di uno stimatore. La media e la varianza campionarie; la proporzione campionaria.
Funzione di verosimiglianza. Stimatori di massima verosimiglianza e loro proprietà. Esempi.
2) Intervalli di confidenza per una media (con osservazioni Normali e varianza nota o ignota). Intervalli di confidenza per una proporzione.
3) Definizione generale del problema della verifica d'ipotesi e di p-value. Verifica d'ipotesi per una media, con osservazioni Normali e varianza nota o ignota; il test t-per il confronto tra 2 medie; il test ANOVA per il confronto tra più medie.
4) Verifica d'ipotesi per una proporzione. Test del chi-quadrato per il confronto tra più proporzioni e per verificare l'indipendenza tra due variabili.
La regressione lineare semplice
1) Presentazione del pacchetto statistico R: come si installa; comandi fondamentali.
2) Definizione di modello di regressione lineare; stima dei parametri (coefficiente angolare e intercetta) col metodo dei minimi quadrati; bontà di adattamento e coefficiente di determinazione; intervallo di confidenza per i coefficienti della retta di regressione; verifica d'ipotesi sull'intercetta e sul coefficiente angolare.
3) L'uso di R per le analisi statistiche descritte al punto 2. Interpretazione dell'output.
Prerequisiti
Per sostenere l'esame di Statistica è necessario aver verbalizzato l'esame di Matematica (propedeuticità).
Metodi didattici
Per quanto riguarda la parte teorica, il docente spiega alla lavagna preferibilmente senza l'uso di slide, la lezione in questo modo è più interattiva e viene adeguata ai bisogni dell'aula, sia in termini di velocità di presentazione dei concetti che di approfondimento degli stessi. Chi non può frequentare può comunque ritrovare tutto nel materiale di riferimento indicato (libro di testo ed eventuali dispense su ARIEL).
Dopo l'introduzione di ogni nuovo concetto vengono presentati vari esempi numerici per comprenderne a fondo il significato ed impratichirsi con i calcoli.
Oltre alle lezioni teoriche vengono svolte anche delle esercitazioni in classe. Gli esercizi svolti durante le esercitazioni sono disponibili sulla pagina web del corso (ARIEL) per agevolare gli studenti non frequentanti.
Per quanto riguarda l'uso del software R nella regressione lineare, il docente presenta dei lucidi con le varie istruzioni da digitare per ciascun tipo di analisi. In classe si svolgono alcuni esempi di analisi di regressione e gli studenti sono invitati a portare con sè un portatile (se ce l'hanno) in modo da allenarsi con il docente. In ogni caso, tutte le istruzioni presentate in aula vengono rese disponibili in ARIEL affinché gli studenti possano riprodurle a casa con il proprio pc.
Commenti e richieste di chiarimenti durante le lezioni/esercitazioni da parte degli studenti sono sempre ben accette, perché rendono le lezioni più vivaci e sicuramente più utili per tutti.
Dopo l'introduzione di ogni nuovo concetto vengono presentati vari esempi numerici per comprenderne a fondo il significato ed impratichirsi con i calcoli.
Oltre alle lezioni teoriche vengono svolte anche delle esercitazioni in classe. Gli esercizi svolti durante le esercitazioni sono disponibili sulla pagina web del corso (ARIEL) per agevolare gli studenti non frequentanti.
Per quanto riguarda l'uso del software R nella regressione lineare, il docente presenta dei lucidi con le varie istruzioni da digitare per ciascun tipo di analisi. In classe si svolgono alcuni esempi di analisi di regressione e gli studenti sono invitati a portare con sè un portatile (se ce l'hanno) in modo da allenarsi con il docente. In ogni caso, tutte le istruzioni presentate in aula vengono rese disponibili in ARIEL affinché gli studenti possano riprodurle a casa con il proprio pc.
Commenti e richieste di chiarimenti durante le lezioni/esercitazioni da parte degli studenti sono sempre ben accette, perché rendono le lezioni più vivaci e sicuramente più utili per tutti.
Materiale di riferimento
I) Statistica descrittiva: due dispense disponibili nella pagina ARIEL del corso: https://myariel.unimi.it/course/view.php?id=4040
II) Probabilità e variabili casuali: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 1-2.
III) Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 3-4-5
e le seguenti dispense integrative:
1) "la stima puntuale"
2) "confronto tra due o più medie (ANOVA)"
3) "Il test del chi-quadrato per l'indipendenza e per il confronto tra più proporzioni. Il test Z per il confronto tra due proporzioni"
4) "Stimatori di Massima Verosimiglianza"
che sono disponibili nella pagina ARIEL del corso: https://myariel.unimi.it/course/view.php?id=4040
IV) Regressione lineare semplice: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLO 6.
Il materiale delle lezioni relative all'uso del software R è disponibile nella pagina del corso sul portale ARIEL: https://myariel.unimi.it/course/view.php?id=4040, dove sono disponibili anche alcuni lucidi delle lezioni.
Durante il corso, vengono caricati periodicamente dei questionari online (con domande a scelta multipla) che possono essere svolti dagli studenti per autovalutare la comprensione degli argomenti svolti.
II) Probabilità e variabili casuali: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 1-2.
III) Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 3-4-5
e le seguenti dispense integrative:
1) "la stima puntuale"
2) "confronto tra due o più medie (ANOVA)"
3) "Il test del chi-quadrato per l'indipendenza e per il confronto tra più proporzioni. Il test Z per il confronto tra due proporzioni"
4) "Stimatori di Massima Verosimiglianza"
che sono disponibili nella pagina ARIEL del corso: https://myariel.unimi.it/course/view.php?id=4040
IV) Regressione lineare semplice: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLO 6.
Il materiale delle lezioni relative all'uso del software R è disponibile nella pagina del corso sul portale ARIEL: https://myariel.unimi.it/course/view.php?id=4040, dove sono disponibili anche alcuni lucidi delle lezioni.
Durante il corso, vengono caricati periodicamente dei questionari online (con domande a scelta multipla) che possono essere svolti dagli studenti per autovalutare la comprensione degli argomenti svolti.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame di Statistica consiste in una prova scritta della durata orientativa di 80/90 minuti.
E' costituita da 3 esercizi e 6 domande a scelta multipla (valutati da 0 a 30 punti), più un esercizio supplementare più teorico (valutato da 0 a 2 punti). Domande ed esercizi riguardano tutti gli argomenti elencati nel programma.
La prova viene considerata sufficiente se si ottiene un punteggio almeno pari a 18.
Per svolgere la prova scritta è necessario portare con sè una calcolatrice.
L'articolazione dell'esame in esercizi+domande a scelta multipla consente di verificare che gli studenti siano in grado di condurre semplici calcoli e analisi statistiche e di interpretarne i risultati.
E' costituita da 3 esercizi e 6 domande a scelta multipla (valutati da 0 a 30 punti), più un esercizio supplementare più teorico (valutato da 0 a 2 punti). Domande ed esercizi riguardano tutti gli argomenti elencati nel programma.
La prova viene considerata sufficiente se si ottiene un punteggio almeno pari a 18.
Per svolgere la prova scritta è necessario portare con sè una calcolatrice.
L'articolazione dell'esame in esercizi+domande a scelta multipla consente di verificare che gli studenti siano in grado di condurre semplici calcoli e analisi statistiche e di interpretarne i risultati.
Siti didattici
Docente/i
Ricevimento:
Dal 9 gennaio 2025, il ricevimento sarà giovedì 9.30-12.30
stanza 33, terzo piano DEMM