Scienze dell'informazione e della comunicazione sul web
A.A. 2021/2022
Obiettivi formativi
La comprensione e l'impiego delle tecniche e degli strumenti che determinano la visibilità dei contenuti web è un tema trasversale e pervasivo nell'ambito dell'Information and Communication Technology (ICT). Esso risulta di interesse non solo per i professionisti delle discipline informatiche, ma anche per gli esperti di comunicazione e per gli studiosi umanisti in generale. La prima parte del corso fornisce le nozioni fondamentali relative alla struttura del web, ai motori di ricerca e alle tecniche per il reperimento delle informazioni. La seconda parte illustra le tecniche per migliorare la visibilità dei contenuti pubblicati su web, più comunemente note come tecniche di Search Engine Optimization (SEO). Inoltre, quest'ultima parte presenta il tema emergente del "web dei dati", ne descrive le principali caratteristiche e differenze rispetto al modello tradizionalmente noto come "web delle informazioni" e infine fornisce le conoscenze necessarie per valutare l'impatto che queste nuovi strumenti hanno sulle convenzionali tecniche SEO.
Risultati apprendimento attesi
Lo studente dovrà possedere un'adeguata misura di Conoscenze e Competenze.
Conoscenze: lo studente dovrà possedere conoscenze relative al reperimento delle informazioni sul web con particolare enfasi rispetto ai motori di ricerca e alle relative tecniche di trasformazione del testo, indicizzazione e elaborazione delle interrogazioni. Saprà descrivere le caratteristiche dei principali modelli di reperimento (booleano vs. vettoriale) e le tecniche per valutare l'efficacia del reperimento con le metriche di precision, recall e misura-F. Inoltre, lo studente dovrà possedere conoscenze relative al tema della visibilità dei siti in termini di reperibilità sui motori di ricerca (il cosiddetto SEO - Search Engine Optimization). A tale scopo, lo studente dovrà conoscere i principali costrutti del linguaggio HTML5, le tecniche di analisi dei link (link analysis), così come la definizione di "web dei dati", le varie tipologie di microdati e l'impatto che tali nozioni hanno sulle tecniche SEO sia di tipo "on-site" sia di tipo "off-site".
Competenze: lo studente acquisirà le seguenti competenze:
· distinguere le caratteristiche e gli ambiti applicativi del modello di reperimento booleano rispetto al modello vettoriale;
· saper applicare le tecniche di trasformazione del testo, indicizzazione e elaborazione delle interrogazioni di un sistema di reperimento delle informazioni;
· saper applicare le tecniche di misurazione della rilevanza di un sistema di reperimento di tipo vettoriale basate su TF-IDF;
· saper applicare le tecniche di valutazione di un sistema di reperimento delle informazioni basate su precision, recall e misura-F;
· saper utilizzare il linguaggio HTML5 per la realizzazione di pagine web;
· saper descrivere le tecniche di analisi dei link e i principali algoritmi basati su analisi dei link per l'ordinamento dei risultati di un motore di ricerca;
· distinguere le caratteristiche dei principali formati per il "web dei dati", quali microdati, RDFa e JSON-LD;
· saper applicare le tecniche SEO.
Conoscenze: lo studente dovrà possedere conoscenze relative al reperimento delle informazioni sul web con particolare enfasi rispetto ai motori di ricerca e alle relative tecniche di trasformazione del testo, indicizzazione e elaborazione delle interrogazioni. Saprà descrivere le caratteristiche dei principali modelli di reperimento (booleano vs. vettoriale) e le tecniche per valutare l'efficacia del reperimento con le metriche di precision, recall e misura-F. Inoltre, lo studente dovrà possedere conoscenze relative al tema della visibilità dei siti in termini di reperibilità sui motori di ricerca (il cosiddetto SEO - Search Engine Optimization). A tale scopo, lo studente dovrà conoscere i principali costrutti del linguaggio HTML5, le tecniche di analisi dei link (link analysis), così come la definizione di "web dei dati", le varie tipologie di microdati e l'impatto che tali nozioni hanno sulle tecniche SEO sia di tipo "on-site" sia di tipo "off-site".
Competenze: lo studente acquisirà le seguenti competenze:
· distinguere le caratteristiche e gli ambiti applicativi del modello di reperimento booleano rispetto al modello vettoriale;
· saper applicare le tecniche di trasformazione del testo, indicizzazione e elaborazione delle interrogazioni di un sistema di reperimento delle informazioni;
· saper applicare le tecniche di misurazione della rilevanza di un sistema di reperimento di tipo vettoriale basate su TF-IDF;
· saper applicare le tecniche di valutazione di un sistema di reperimento delle informazioni basate su precision, recall e misura-F;
· saper utilizzare il linguaggio HTML5 per la realizzazione di pagine web;
· saper descrivere le tecniche di analisi dei link e i principali algoritmi basati su analisi dei link per l'ordinamento dei risultati di un motore di ricerca;
· distinguere le caratteristiche dei principali formati per il "web dei dati", quali microdati, RDFa e JSON-LD;
· saper applicare le tecniche SEO.
Periodo: Secondo semestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo semestre
Le seguenti indicazioni sono da considerare valide solo nel caso di restrizioni per ragioni sanitarie da parte delle autorità competenti (lockdown).
Metodi didattici:
Le lezioni si terranno in videoconferenza utilizzando lo strumento Microsoft Teams secondo l'orario ufficiale. Inoltre, le lezioni saranno registrate e lasciate a disposizione degli studenti sulla pagina Microsoft Teams dell'insegnamento.
Il calendario delle lezioni e gli eventuali aggiornamenti alle attività del corso saranno pubblicati sul sito Ariel dell'insegnamento.
Materiali di riferimento:
Il programma d'esame e il materiale di riferimento sono invariati.
Modalità di verifica dell'apprendimento e criteri di valutazione:
La prova d'esame si svolgerà in modalità remota secondo le disposizioni dell'Ateneo che saranno comunicate sulla pagina Ariel dell'insegnamento. La struttura delle prove d'esame e i criteri di valutazione sono invariati.
Metodi didattici:
Le lezioni si terranno in videoconferenza utilizzando lo strumento Microsoft Teams secondo l'orario ufficiale. Inoltre, le lezioni saranno registrate e lasciate a disposizione degli studenti sulla pagina Microsoft Teams dell'insegnamento.
Il calendario delle lezioni e gli eventuali aggiornamenti alle attività del corso saranno pubblicati sul sito Ariel dell'insegnamento.
Materiali di riferimento:
Il programma d'esame e il materiale di riferimento sono invariati.
Modalità di verifica dell'apprendimento e criteri di valutazione:
La prova d'esame si svolgerà in modalità remota secondo le disposizioni dell'Ateneo che saranno comunicate sulla pagina Ariel dell'insegnamento. La struttura delle prove d'esame e i criteri di valutazione sono invariati.
Programma
L'insegnamento è organizzato in due parti.
Il programma della parte A (20 ore - 3CFU) prevede la trattazione dei seguenti argomenti:
· Reperimento delle informazioni e motori di ricerca
· Modelli di reperimento (booleano vs. vettoriale)
· Tecniche di analisi automatica del testo
· Indicizzazione di contenuti web
· Elaborazione delle interrogazioni
· Valutazione di un sistema di reperimento delle informazioni
Il programma della parte B (20 ore - 3CFU) prevede la trattazione dei seguenti argomenti:
· Tecniche di analisi dei link (link analysis)
· Nozioni di HTML5
· Linguaggi per il web dei dati
· Visibilità dei siti e tecniche SEO (Search Engine Optimization)
· Tecniche SEO "on-site"
· Tecniche SEO "off-site"
Il programma della parte A (20 ore - 3CFU) prevede la trattazione dei seguenti argomenti:
· Reperimento delle informazioni e motori di ricerca
· Modelli di reperimento (booleano vs. vettoriale)
· Tecniche di analisi automatica del testo
· Indicizzazione di contenuti web
· Elaborazione delle interrogazioni
· Valutazione di un sistema di reperimento delle informazioni
Il programma della parte B (20 ore - 3CFU) prevede la trattazione dei seguenti argomenti:
· Tecniche di analisi dei link (link analysis)
· Nozioni di HTML5
· Linguaggi per il web dei dati
· Visibilità dei siti e tecniche SEO (Search Engine Optimization)
· Tecniche SEO "on-site"
· Tecniche SEO "off-site"
Prerequisiti
Non sono richieste conoscenze preliminari.
Metodi didattici
Sono previste lezioni frontali con l'ausilio di slide e materiali didattici che saranno progressivamente resi disponibili sul sito web dell'insegnamento in piattaforma Ariel. Uno spazio specifico è riservato all'analisi di casi di studio reali mirati a illustrare l'applicazione concreta dei contenuti teorici affrontati durante lo svolgimento delle lezioni. Sono previsti seminari con testimonianze di professionisti esterni in materia di comunicazione sul web.
La frequenza, per quanto non obbligatoria, è fortemente consigliata.
La frequenza, per quanto non obbligatoria, è fortemente consigliata.
Materiale di riferimento
Il materiale di riferimento per studenti frequentanti e non frequentanti è il medesimo.
Per la parte A, un testo a scelta tra:
· C.D. Manning, P. Raghavan, H. Schütze. Introduction to Information Retrieval. Cambridge University Press. 2008. Testo in Inglese, disponibile gratuitamente online (http://nlp.stanford.edu/IR-book/information-retrieval-book.html).
Capitoli: 1 (escluso "query optimization" in 1.3), 2 (esclusi 2.3 e 2.4.3), 3 (esclusi 3.2.1 e 3.4), 4 (esclusi "logarithmic merging" in 4.5 e 4.6), 6 (esclusi 6.1, 6.3.3 e 6.4), 8 (compreso 8.4 solo "precision at k" e "r-precision", esclusi 8.5 - 8.7).
· W.B. Croft, D. Metzler, T. Strohman. Search Engines, Information Retrieval in Practice. Pearson Education. 2015. Testo in Inglese, disponibile gratuitamente online (http://ciir.cs.umass.edu/downloads/SEIRiP.pdf).
Capitoli: 1, 2, 3 (esclusi 3.2.3, 3.6 - 3.8), 4 (compreso 4.5.2 tralasciando i dettagli matematici, esclusi 4.2.2, 4.6, 4.7), 5 (esclusi 5.4 - 5.7), 6 (compreso 6.2.2 e 6.3.1 tralasciando i dettagli matematici, escluso 6.2.3), 7.1, 8 (esclusi 8.4.2, 8.4.3, 8.4.4, 8.5 - 8.7).
Per la parte B:
· C.D. Manning, P. Raghavan, H. Schütze. Introduction to Information Retrieval. Cambridge University Press. 2008. Testo in Inglese, disponibile gratuitamente online (http://nlp.stanford.edu/IR-book/information-retrieval-book.html).
Capitoli: 19 (compreso 19.5 tralasciando i dettagli matematici, escluso 19.6), 20 (escluso 20.3, 20.4), 21 (fino a 21.2.1 escluso).
· Introduzione a HTML5 (https://www.web-link.it/intro-html5.html). Si considerino i seguenti argomenti della guida: 01. Introduzione, 02. Struttura documento, 03. Elementi Semantici, 06. Video, 07. Audio, 08. Canvas, 09. Conclusioni.
· Linked data e web semantico (http://www.bibliotecheoggi.it/pdf.php?filepdf=20120300701.pdf).
· Introduzione ai dati strutturati su web (https://developers.google.com/search/docs/guides/intro-structured-data).
· Introduzione ai microdati (https://schema.org/docs/gs.html, testo in lingua inglese).
Inoltre, un testo a scelta tra:
· M. Maltraversi. SEO e SEM. Guida avanzata al Web marketing (quarta edizione). LSWR edizioni. 2016. Testo in Italiano.
· E. Enge, S. Spencer, J.C. Stricchiola. The Art of SEO: Mastering Search Engine Optimization. O'Reilly Editore, terza edizione. 2015. Testo in Inglese. Di questo testo, è ammessa anche la versione tradotta e rivisitata in lingua italiana a cura di Jacopo Matteuzzi e Flavio Mazzanti edito da Flacowski.
Per la parte A, un testo a scelta tra:
· C.D. Manning, P. Raghavan, H. Schütze. Introduction to Information Retrieval. Cambridge University Press. 2008. Testo in Inglese, disponibile gratuitamente online (http://nlp.stanford.edu/IR-book/information-retrieval-book.html).
Capitoli: 1 (escluso "query optimization" in 1.3), 2 (esclusi 2.3 e 2.4.3), 3 (esclusi 3.2.1 e 3.4), 4 (esclusi "logarithmic merging" in 4.5 e 4.6), 6 (esclusi 6.1, 6.3.3 e 6.4), 8 (compreso 8.4 solo "precision at k" e "r-precision", esclusi 8.5 - 8.7).
· W.B. Croft, D. Metzler, T. Strohman. Search Engines, Information Retrieval in Practice. Pearson Education. 2015. Testo in Inglese, disponibile gratuitamente online (http://ciir.cs.umass.edu/downloads/SEIRiP.pdf).
Capitoli: 1, 2, 3 (esclusi 3.2.3, 3.6 - 3.8), 4 (compreso 4.5.2 tralasciando i dettagli matematici, esclusi 4.2.2, 4.6, 4.7), 5 (esclusi 5.4 - 5.7), 6 (compreso 6.2.2 e 6.3.1 tralasciando i dettagli matematici, escluso 6.2.3), 7.1, 8 (esclusi 8.4.2, 8.4.3, 8.4.4, 8.5 - 8.7).
Per la parte B:
· C.D. Manning, P. Raghavan, H. Schütze. Introduction to Information Retrieval. Cambridge University Press. 2008. Testo in Inglese, disponibile gratuitamente online (http://nlp.stanford.edu/IR-book/information-retrieval-book.html).
Capitoli: 19 (compreso 19.5 tralasciando i dettagli matematici, escluso 19.6), 20 (escluso 20.3, 20.4), 21 (fino a 21.2.1 escluso).
· Introduzione a HTML5 (https://www.web-link.it/intro-html5.html). Si considerino i seguenti argomenti della guida: 01. Introduzione, 02. Struttura documento, 03. Elementi Semantici, 06. Video, 07. Audio, 08. Canvas, 09. Conclusioni.
· Linked data e web semantico (http://www.bibliotecheoggi.it/pdf.php?filepdf=20120300701.pdf).
· Introduzione ai dati strutturati su web (https://developers.google.com/search/docs/guides/intro-structured-data).
· Introduzione ai microdati (https://schema.org/docs/gs.html, testo in lingua inglese).
Inoltre, un testo a scelta tra:
· M. Maltraversi. SEO e SEM. Guida avanzata al Web marketing (quarta edizione). LSWR edizioni. 2016. Testo in Italiano.
· E. Enge, S. Spencer, J.C. Stricchiola. The Art of SEO: Mastering Search Engine Optimization. O'Reilly Editore, terza edizione. 2015. Testo in Inglese. Di questo testo, è ammessa anche la versione tradotta e rivisitata in lingua italiana a cura di Jacopo Matteuzzi e Flavio Mazzanti edito da Flacowski.
Modalità di verifica dell’apprendimento e criteri di valutazione
Studenti frequentanti e non frequentanti: la verifica dell'apprendimento consiste in una prova scritta sull'intero programma del corso e una prova di approfondimento. La prova scritta è composta da quiz, domande aperte ed esercizi. I parametri di valutazione sono la capacità di presentare chiaramente la conoscenza, la completezza delle risposte, la correttezza dei ragionamenti nello svolgimento degli esercizi.
La prova di approfondimento verte su un tema o un caso di studio concordato con il docente in seguito al superamento della prova scritta. I parametri di valutazione sono la capacita' di presentare in modo chiaro ed efficace le proprie considerazioni rispetto allo studio realizzato, la competenza nell'impiego della terminologia specialistica. La valutazione è espressa in trentesimi e sintetizza il risultato conseguito nella prova scritta e in quella di approfondimento.
Gli studenti Erasmus incoming avranno la possibilità, se lo richiedono, di sostenere l'esame in lingua inglese secondo un programma che dovrà essere concordato con il docente.
Le modalità d'esame per studenti con disabilità e/o con DSA dovranno essere concordate col docente, in accordo con l'Ufficio competente.
La prova di approfondimento verte su un tema o un caso di studio concordato con il docente in seguito al superamento della prova scritta. I parametri di valutazione sono la capacita' di presentare in modo chiaro ed efficace le proprie considerazioni rispetto allo studio realizzato, la competenza nell'impiego della terminologia specialistica. La valutazione è espressa in trentesimi e sintetizza il risultato conseguito nella prova scritta e in quella di approfondimento.
Gli studenti Erasmus incoming avranno la possibilità, se lo richiedono, di sostenere l'esame in lingua inglese secondo un programma che dovrà essere concordato con il docente.
Le modalità d'esame per studenti con disabilità e/o con DSA dovranno essere concordate col docente, in accordo con l'Ufficio competente.
Moduli o unità didattiche
Unita' didattica A
INF/01 - INFORMATICA - CFU: 3
Lezioni: 20 ore
Unita' didattica B
INF/01 - INFORMATICA - CFU: 3
Lezioni: 20 ore
Docente/i
Ricevimento:
Su appuntamento da concordare via email
Stanza 7015, Dipartimento di Informatica "Giovanni degli Antoni", Via Celoria 18 - 20133 Milano