logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-07042011-121355


Tipo di tesi
Tesi di laurea specialistica
Autore
VITALE, DANIELE
URN
etd-07042011-121355
Titolo
Un classificatore di testi brevi basato su un'annotazione con pagine di Wikipedia
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
TECNOLOGIE INFORMATICHE
Relatori
relatore Prof. Ferragina, Paolo
Parole chiave
  • Information Retrieval
  • Text Categorization
  • Wikipedia
Data inizio appello
22/07/2011
Consultabilità
Parziale
Data di rilascio
22/07/2051
Riassunto
L'obiettivo principale di questo lavoro di tesi è stato lo sviluppo di un classificatore di testi che sfrutta
l'annotazione semantica di documenti fornita da TAGME, uno strumento che che individua termini significativi all'interno
di testi non strutturati e le collega a pertinenti pagine di wikipedia. Il target della classificazione è rappresentato da
testi particolarmente brevi, nell'ordine dei 10-15 termini, un contesto dove il paradigma bag-of-words risulta poco efficace.
File