logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-07042011-121355


Thesis type
Tesi di laurea specialistica
Author
VITALE, DANIELE
URN
etd-07042011-121355
Thesis title
Un classificatore di testi brevi basato su un'annotazione con pagine di Wikipedia
Department
SCIENZE MATEMATICHE, FISICHE E NATURALI
Course of study
TECNOLOGIE INFORMATICHE
Supervisors
relatore Prof. Ferragina, Paolo
Keywords
  • Information Retrieval
  • Text Categorization
  • Wikipedia
Graduation session start date
22/07/2011
Availability
Partial
Release date
22/07/2051
Summary
L'obiettivo principale di questo lavoro di tesi è stato lo sviluppo di un classificatore di testi che sfrutta
l'annotazione semantica di documenti fornita da TAGME, uno strumento che che individua termini significativi all'interno
di testi non strutturati e le collega a pertinenti pagine di wikipedia. Il target della classificazione è rappresentato da
testi particolarmente brevi, nell'ordine dei 10-15 termini, un contesto dove il paradigma bag-of-words risulta poco efficace.
File