Ricerca e Distribuzione dell'Informazione nel Web

Anno Academico 2011-2012

Corso di Laurea in Ingegneria Informatica - Laurea Magistrale


Avvisi

9/7/2012: Gli studenti che vogliono sostenere l'esame il 20/7/2012 devono consegnare le loro tesine fino a 19/7/2012. Per la consegna contattate Ida Mele.

31/1/2012: L'esame del 2 febbraio, si svolgerà nell'Aula B2 (Via Ariosto 25) alle 10.00. Il tempo a disposizione sarà 90 min. Alle 14.00 si passa dalla stanza B118 per discorso e per ricevere il voto.

16/1/2012: A causa di problemi con INFOSTUD, gli studenti che vogliono prenotarsi all'appello del 2 febbraio, anche gli studenti che hanno sostenuto l'esame del 11 gennaio, sono richiesti di prenotare a qualche appello di Anagnostopoulos o di Leonardi e di inviare un'email con nome, cognome, matricola, ad aris@cs.brown.edu.

9/1/2012: L'esame dell' 11 gennaio, si svolgerà nell'Aula B2 (Via Ariosto 25) alle 10.00. Il tempo a disposizione sarà 90 min. Alle 14.00 si passa dalla stanza B118 per discorso e per ricevere il voto.

4/1/2012: A causa di problemi con INFOSTUD, non è possibile prenotarsi per l'appello di 11 gennaio. Gli studenti che vogliono prenotarsi, devono inviare un'email con nome, cognome, matricola, ad aris@cs.brown.edu chiedendo di sostenere l'esame.

30/12/2011: Gli studenti che sostengono i primi due appelli (gennaio e febbraio 2012) del corso, possono consegnare il progetto fino al 20 febbraio 2012.

19/12/2011: L'ultima lezione del corso è stata oggi, lunedi 19/12.

12/12/2011: La lezione di 13/12 si svolgerà in Aula A4.

4/12/2011: Pagina web con l'info sull'esercitazione di Ilaria Bordino.

22/11/2011: Le slide su link analysis sono aggiornate dopo il discorso sulla convergenza di HITS.

21/11/2011: Si puo trovare informazione sui progetti nella pagina dell'anno scorso. L'informazione è solo indicativa, ci sarano alcuni cambi nei progetti e le regole. Il progetto deve essere svolto in gruppo. Ogni gruppo deve essere formato da due o tre studenti. In casi eccezionali il gruppo può essere composto da un solo membro. Un progetto può essere assegnato al massimo a 2 gruppi.

21/11/2011: I gruppi che vogliono come progetto il tema della competizione di WSDM 2012 devono registrare presto nel sito della competizione e scaricare i dati dopo leggere un non-disclosure agreement.

22/10/2011: Il 31/10 e il 1/11 non abbiamo lezione (festa di Ognissanti).

11/10/2011: Richiesta di partecipare nell'esperimento organizzato dal gruppo di algoritmi per lo studio dell'evoluzione delle relazioni sociali nel tempo.


Docenti

Dr. Aris Anagnostopoulos, Sapienza Università di Roma, email: aris@cs.brown.edu.

Laboratorio

Dr. Ilaria Bordino, Yahoo! Research, email: bordino@dis.uniroma1.it.
Ing. Ida Mele, Yahoo! Research, email: mele@dis.uniroma1.it.

Quando e Dove

Quando: Lunedi 10.15-13.30 (Aula A3) e martedi 15.45-17.15 (Aula A5).
Dove: Via Ariosto 25, Aule A3, A5.

Ricevimento

Inviate un email ad aris@cs.brown.edu.

Libro

Il libro principale è l' Introduction to Information Retrieval, by Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze.

Altri riferimenti:

Search Engines: Information Retrieval in Practice, by W. Bruce Croft, Donald Metzler, and Trevor Strohman
Managing Gigabytes, second edition, by Ian H. Witten, Alistair Moffat, and Timothy C. Bell
Modern Information Retrieval, second edition, by Ricardo Baeza-Yates and Berthier Ribeiro-Neto

Soggetti che copriremo


Esami

L'esame prevede lo svolgimento di una prova scritta sui temi affrontati nel corso e di un progetto a scelta del candidato. Il progetto deve essere consegnato in occasione della prova scritta ad eccezione che per gli studenti che sostengono i primi due appelli (gennaio e febbraio 2012) del corso per cui la consegna e' possibile fino al 20 febbraio 2012. L'Ing. Ida Mele segue l'assegnazione e lo svolgimento dei progetti.

Esercitazioni

Pagina web con l'info sull'esercitazioni di Ilaria Bordino.
Pagina web con l'info sull'esercitazioni di Ida Mele, e con informazione sui progetti.

Slides

Date Topics File
3/10 Introduction pdf
3/10 Tokenization, normalization, speedup, phrase queries pdf
10/10 Index construction pdf
11/10 Dictionary, index compression (updated 16/10) pdf
17/10 Field search, weighting pdf
18/10 Vector space model pdf
24/10 Sorting and results assembly pdf
24/10 Evaluation in information retrieval pdf
25/10 Esercizi che abbiamo fatto a lezione pdf
7/11 Information retrieval in the web pdf
8/11 Crawling and near-duplicate document detection pdf
14/11 Graph structure of the Web for IR pdf
14/11 Link analysis for ranking (updated 22/11) pdf
21/11 Esercizi che abbiamo fatto a lezione pdf
19/12 Introduction to text classification and clustering pdf
19/12 Text classification pdf
19/12 Clustering pdf