logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-11182012-221824


Tipo di tesi
Tesi di laurea magistrale
Autore
PORCU, CLAUDIO
URN
etd-11182012-221824
Titolo
Sull'uso degli analizzatori semantici per la profilazione degli utenti di Twitter
Dipartimento
INFORMATICA
Corso di studi
INFORMATICA
Relatori
relatore Ferragina, Paolo
Parole chiave
  • Information Retrieval
Data inizio appello
07/12/2012
Consultabilità
Parziale
Data di rilascio
07/12/2052
Riassunto
Realizzare dei profili sulle persone a partire da ciò che queste condividono sul Web è uno dei problemi oggi più investigati dell'Information Retrieval. In questa tesi viene utilizzato un annotatore di entità per definire un innovativo modello di profilo basato sui Tweet scritti da un utente. Tale profilo è rappresentativo degli interessi dell'utente stesso, e per la sua realizzazione viene utilizzato TagMe, un annotatore adatto ai testi brevi quali sono i Tweet, affiancato dallo Stanford Parser, un parser sintattico che definisce la struttura grammaticale di una frase.

Le annotazioni e le relazioni prodotte dal parser vengono quindi combinate per identificare gli argomenti principali all'interno dei Tweet, in modo da creare un profilo che sia compatto ma allo stesso tempo il più possibilmente preciso e completo. La validità di questo modello di profilo viene valutata confrontandolo con altri modelli definiti in letteratura, attraverso una serie di esperimenti che riguardano due task classici quali la raccomandazione di Tweet o di news. I risultati ottenuti dimostrano che l'uso degli annotatori consente di migliorare le performance note dei sistemi noti in letteratura, rendendo quindi l'approccio proposto molto promettente.
File