Statistica

A.A. 2018/2019
12
Crediti massimi
80
Ore totali
SSD
SECS-S/01
Lingua
Italiano
Obiettivi formativi
L'obiettivo del corso di "Statistica" è fornire le nozioni di base di statistica descrittiva e inferenziale, in modo che lo studente sia in grado di individuare gli strumenti più appropriati per l'analisi dei dati e per affrontare i problemi pratici più comuni. Con questo insegnamento si gettano le basi per poter affrontare altri corsi di statistica più specifici per il corso di laurea in Economia e Management, quali "Statistica per le decisioni aziendali", "Econometria" e "Statistica per i Big Data". Al termine del corso lo studente sarà in grado di costruire, leggere tabelle di frequenza e interpretare i principali indicatori statistici. Sarà inoltre in grado di svolgere semplici analisi di dati calcolando e interpretando stime puntuali e intervallari e di risolvere i più comuni problemi di verifica d'ipotesi, quali il confronto tra medie e la verifica d'indipendenza tra variabili. Infine sarà in grado di svolgere con il software statistico R una regressione lineare semplice e di interpretarne l'output. L'esame scritto, nonostante preveda lo svolgimento di tre esercizi, è strutturato in modo da verificare che i concetti basilari di statistica descrittiva e inferenziale siano stati davvero assimilati.
Risultati apprendimento attesi
Non definiti
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Primo trimestre

STUDENTI FREQUENTANTI
Programma
I) Statistica descrittiva
1) Classificazione dei fenomeni statistici (tipi di caratteri e scale di modalità) e distribuzioni di frequenza (frequenze assolute, relative e cumulate).
2) Rappresentazioni grafiche: grafico a barre, grafico a bastoncini, istogramma di frequenze.
3) Calcolo di: moda, mediana e media campionarie quando i dati sono classificati in una tabella. Teoremi e proprietà della media.
4) Alcuni indici di variabilità e dispersione: campo di variazione, differenza e scarto interquartile, varianza e scarto quadratico medio. Il coefficiente di variazione.
5) Tabelle di contingenza e analisi bivariata. La covarianza e il coefficiente di correlazione lineare.

II) Probabilità e variabili casuali
1) Introduzione al calcolo delle probabilità: impostazioni della probabilità (classica, frequentista, soggettivista, assiomatica), eventi elementari, composti e incompatibili, principio delle probabilità composte, indipendenza stocastica, teorema di Bayes, principio delle probabilità totali, tipologie di campionamento (estrazioni con e senza reinserimento tenendo conto o meno dell'ordine).
2) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, densità di probabilità, funzione di ripartizione; valore atteso (o media), moda, mediana, varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali.
3) Cenni al teorema del limite centrale e alla legge dei grandi numeri.
4) Le variabili casuali di Bernoulli, Normale e Binomiale; approssimazione Normale alla Binomiale.

III) Statistica inferenziale
1) La stima puntuale: definizione di stimatore non distorto; l'errore standard: una misura di precisione di uno stimatore. La media e la varianza campionarie; la proporzione campionaria.
2) Intervalli di confidenza per una media (con osservazioni Normali e varianza nota o ignota). Intervalli di confidenza per una proporzione.
3) Definizione generale del problema della verifica d'ipotesi e di p-value. Verifica d'ipotesi per una media, con osservazioni Normali e varianza nota o ignota; il test t-per il confronto tra 2 medie; il test ANOVA per il confronto tra più medie.
4) Verifica d'ipotesi per una proporzione. Definizione di distribuzioni di frequenza congiunte assolute e relative, marginali e condizionate per poter definire il test del chi-quadrato, che può essere usato per il confronto tra più proporzioni e per valutare l'indipendenza tra due variabili.

IV) La regressione lineare semplice (20 ore)
1) Presentazione del pacchetto statistico R: come si installa; comandi fondamentali.
2) Definizione di modello di regressione lineare; stima dei parametri (coefficiente angolare e intercetta) col metodo dei minimi quadrati; bontà di adattamento e coefficiente di determinazione; intervallo di confidenza per i coefficienti della retta di regressione; verifica d'ipotesi sull'intercetta e sul coefficiente angolare.
3) L'uso di R per le analisi statistiche descritte al punto 2. Interpretazione dell'output.
Informazioni sul programma
Questo corso si articola in un programma piuttosto vasto che riguarda: i concetti basilari della probabilità, gli strumenti fondamentali della statistica descrittiva, i principali strumenti della statistica inferenziale e l'uso del software R per l'analisi della regressione lineare.
L'obiettivo è rendere lo studente in grado non solo di riprodurre grafici e tabelle di sintesi ma anche di saper affrontare problemi più complessi inerenti la stima di una media o una proporzione, di operare confronti tra più medie e proporzioni, di effettuare un'analisi di regressione attraverso anche l'interpretazione dell'output di un software statistico. Queste tipologie di problemi emergono frequentemente nella realtà pratica di tutti i giorni.
Propedeuticità
Per gli studenti del Corso di Laurea Economia e Management, il regolamento didattico prevede la propedeuticità di Matematica su Statistica.
Per tutti gli altri studenti che dovessero scegliere Statistica come esame facoltativo si consiglia di ripassare i concetti basilari di matematica: studio di funzioni, derivate, integrali, serie.
Prerequisiti
Per poter comprendere il corso è necessario conoscere i concetti di base di matematica (funzioni, derivate, integrali, serie) ed avere sviluppato una certa abilità nei calcoli. Per questa ragione, per gli studenti di Economia e Mangement, l'esame di Matematica (del primo anno) è propedeutico all'esame di Statistica.
Ai fini del superamento dell'esame è necessario che lo studente comprenda a fondo i concetti spiegati in aula e trattati nel testo di riferimento e nelle dispense disponibili in ARIEL.
Il solo svolgimento degli esercizi non è assolutamente sufficiente ai fini della preparazione dell'esame, in quanto se non si è compresa a fondo la teoria non si riesce a impostare nel modo corretto gli esercizi e non si riescono ad individuare gli strumenti da utilizzare.

L'esame consiste in una prova scritta della durata di 1 ora e 45 minuti ed è formato da due moduli (entrambi vengono consegnati durante la prova d'esame). Il primo modulo è costituito da 3 esercizi e 6 domande a scelta multipla; il secondo invece è costituito da un esercizio più di impostazione teorica. Con lo svolgimento del primo modulo si possono conseguire fino a 30 punti. Il superamento del primo modulo è necessario per il superamento dell'intero esame. Al fine di migliorare il voto, solo per chi ottiene almeno 18 nel primo modulo viene corretto il secondo, il cui punteggio (al massimo 2 punti) viene aggiunto a quello ottenuto nel primo modulo.
Anche nella pagina web del corso (ARIEL) sono disponibili tutte le informazioni relative allo svolgimento dell'esame.
Metodi didattici
Per quanto riguarda la parte teorica, la docente spiega alla lavagna tendenzialmente senza l'uso di slide, la lezione in questo modo è più interattiva e viene adeguata adeguata ai bisogni dell'aula, sia in termini di velocità di presentazione dei concetti che di approfondimanto degli stessi. Chi non può frequentare può comunque ritrovare tutto nel materiale di riferimento indicato (libro di testo ed eventuali dispense su ARIEL).
Dopo l'introduzione di ogni nuovo concetto vengono presentati vari esempi numerici per comprenderne a fondo il significato ed impratichirsi con i calcoli.

Oltre alle lezioni teoriche vengono svolte anche delle esercitazioni in classe. Gli esercizi svolti durante le esercitazioni sono disponibili sulla pagina web del corso (ARIEL) per agevolare gli studenti non frequentanti.

Per quanto riguarda l'uso del software R nella regressione lineare, il docente presenta dei lucidi con le varie istruzioni da digitare per ciascun tipo di analisi. In classe si svolgono alcuni esempi di analisi di regressione e gli studenti sono invitati a portare con sè un portatile (se ce l'hanno) in modo da allenarsi con il docente. In ogni caso, tutte le istruzioni presentate in aula vengono rese disponibili in ARIEL affinché gli studenti possano riprodurle a casa con il proprio pc.

Commenti e richieste di chiarimenti durante le lezioni/esercitazioni da parte degli studenti sono sempre ben accette, perché rendono le lezioni più vivaci e sicuramente più utili per tutti.
Materiale di riferimento
I) Statistica descrittiva: Dispensa dal titolo "statistica descrittiva" disponibile nella pagina web del corso: http://ctommasis.ariel.ctu.unimi.it/v5 (sotto le voci: contenuti - lezioni)

II) Probabilità e variabili casuali: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 1-2.

III) Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 3-4-5
e le seguenti dispense integrative:
1) "la stima puntuale"
2) "confronto tra due o più medie (ANOVA)"
3) "Il test del chi-quadrato per l'indipendenza e per il confronto tra più proporzioni. Il test Z per il confronto tra due proporzioni"
che sono disponibili nella pagina web del corso: http://ctommasis.ariel.ctu.unimi.it/v5 (sotto le voci: contenuti - lezioni).

IV) Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLO 6.
Il materiale delle lezioni relative all'uso del software R sono disponibili nella pagina del corso sul portale ARIEL: https://ctommasis.ariel.ctu.unimi.it/v5.


Si sta scrivendo una nuova versione aggiornata del libro, che dovrebbe includere tutti gli argomenti trattati a lezione e anche le istruzioni in R; appena il libro sarà disponibile si metterà un avviso in ARIEL.
STUDENTI NON FREQUENTANTI
Programma
I) Statistica descrittiva
1) Classificazione dei fenomeni statistici (tipi di caratteri e scale di modalità) e distribuzioni di frequenza (frequenze assolute, relative e cumulate).
2) Rappresentazioni grafiche: grafico a barre, grafico a bastoncini, istogramma di frequenze.
3) Calcolo di: moda, mediana e media campionarie quando i dati sono classificati in una tabella. Teoremi e proprietà della media.
4) Alcuni indici di variabilità e dispersione: campo di variazione, differenza e scarto interquartile, varianza e scarto quadratico medio. Il coefficiente di variazione.
5) Tabelle di contingenza e analisi bivariata. La covarianza e il coefficiente di correlazione lineare.

II) Probabilità e variabili casuali
1) Introduzione al calcolo delle probabilità: impostazioni della probabilità (classica, frequentista, soggettivista, assiomatica), eventi elementari, composti e incompatibili, principio delle probabilità composte, indipendenza stocastica, teorema di Bayes, principio delle probabilità totali, tipologie di campionamento (estrazioni con e senza reinserimento tenendo conto o meno dell'ordine).
2) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, densità di probabilità, funzione di ripartizione; valore atteso (o media), moda, mediana, varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali.
3) Cenni al teorema del limite centrale e alla legge dei grandi numeri.
4) Le variabili casuali di Bernoulli, Normale e Binomiale; approssimazione Normale alla Binomiale.

III) Statistica inferenziale
1) La stima puntuale: definizione di stimatore non distorto; l'errore standard: una misura di precisione di uno stimatore. La media e la varianza campionarie; la proporzione campionaria.
2) Intervalli di confidenza per una media (con osservazioni Normali e varianza nota o ignota). Intervalli di confidenza per una proporzione.
3) Definizione generale del problema della verifica d'ipotesi e di p-value. Verifica d'ipotesi per una media, con osservazioni Normali e varianza nota o ignota; il test t-per il confronto tra 2 medie; il test ANOVA per il confronto tra più medie.
4) Verifica d'ipotesi per una proporzione. Definizione di distribuzioni di frequenza congiunte assolute e relative, marginali e condizionate per poter definire il test del chi-quadrato, che può essere usato per il confronto tra più proporzioni e per valutare l'indipendenza tra due variabili.

IV) La regressione lineare semplice (20 ore)
1) Presentazione del pacchetto statistico R: come si installa; comandi fondamentali.
2) Definizione di modello di regressione lineare; stima dei parametri (coefficiente angolare e intercetta) col metodo dei minimi quadrati; bontà di adattamento e coefficiente di determinazione; intervallo di confidenza per i coefficienti della retta di regressione; verifica d'ipotesi sull'intercetta e sul coefficiente angolare.
3) L'uso di R per le analisi statistiche descritte al punto 2. Interpretazione dell'output.
Prerequisiti
Per poter comprendere il corso è necessario conoscere i concetti di base di matematica (funzioni, derivate, integrali, serie) ed avere sviluppato una certa abilità nei calcoli. Per questa ragione, per gli studenti di Economia e Mangement, l'esame di Matematica (del primo anno) è propedeutico all'esame di Statistica.
Ai fini del superamento dell'esame è necessario che lo studente comprenda a fondo i concetti spiegati in aula e trattati nel testo di riferimento e nelle dispense disponibili in ARIEL.
Il solo svolgimento degli esercizi non è assolutamente sufficiente ai fini della preparazione dell'esame, in quanto se non si è compresa a fondo la teoria non si riesce a impostare nel modo corretto gli esercizi e non si riescono ad individuare gli strumenti da utilizzare.

L'esame consiste in una prova scritta della durata di 1 ora e 45 minuti ed è formato da due moduli (entrambi vengono consegnati durante la prova d'esame). Il primo modulo è costituito da 3 esercizi e 6 domande a scelta multipla; il secondo invece è costituito da un esercizio più di impostazione teorica. Con lo svolgimento del primo modulo si possono conseguire fino a 30 punti. Il superamento del primo modulo è necessario per il superamento dell'intero esame. Al fine di migliorare il voto, solo per chi ottiene almeno 18 nel primo modulo viene corretto il secondo, il cui punteggio (al massimo 2 punti) viene aggiunto a quello ottenuto nel primo modulo.
Anche nella pagina web del corso (ARIEL) sono disponibili tutte le informazioni relative allo svolgimento dell'esame.
Materiale di riferimento
I) Statistica descrittiva: Dispensa dal titolo "statistica descrittiva" disponibile nella pagina web del corso: http://ctommasis.ariel.ctu.unimi.it/v5 (sotto le voci: contenuti - lezioni)

II) Probabilità e variabili casuali: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 1-2.

III) Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 3-4-5
e le seguenti dispense integrative:
1) "la stima puntuale"
2) "confronto tra due o più medie (ANOVA)"
3) "Il test del chi-quadrato per l'indipendenza e per il confronto tra più proporzioni. Il test Z per il confronto tra due proporzioni"
che sono disponibili nella pagina web del corso: http://ctommasis.ariel.ctu.unimi.it/v5 (sotto le voci: contenuti - lezioni).

IV) Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLO 6.
Il materiale delle lezioni relative all'uso del software R sono disponibili nella pagina del corso sul portale ARIEL: https://ctommasis.ariel.ctu.unimi.it/v5.


Si sta scrivendo una nuova versione aggiornata del libro, che dovrebbe includere tutti gli argomenti trattati a lezione e anche le istruzioni in R; appena il libro sarà disponibile si metterà un avviso in ARIEL.
SECS-S/01 - STATISTICA - CFU: 12
Lezioni: 80 ore
Docente/i
Ricevimento:
giovedì 9.30-12.30. PROSSIMI RICEVIMENTI: MARTEDI' 15 APRILE 14.30-17.30; MARTEDI' 29 APRILE 9.30-12.30
stanza 33, terzo piano DEMM
Ricevimento:
Mercoledì dalle 9:00 alle 12:00 (controllare la bacheca su ARIEL per eventuali cambiamenti).
Ufficio n.35, III piano di via Conservatorio