Tesi etd-07042011-121355 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea specialistica
Autore
VITALE, DANIELE
URN
etd-07042011-121355
Titolo
Un classificatore di testi brevi basato su un'annotazione con pagine di Wikipedia
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
TECNOLOGIE INFORMATICHE
Relatori
relatore Prof. Ferragina, Paolo
Parole chiave
- Information Retrieval
- Text Categorization
- Wikipedia
Data inizio appello
22/07/2011
Consultabilità
Parziale
Data di rilascio
22/07/2051
Riassunto
L'obiettivo principale di questo lavoro di tesi è stato lo sviluppo di un classificatore di testi che sfrutta
l'annotazione semantica di documenti fornita da TAGME, uno strumento che che individua termini significativi all'interno
di testi non strutturati e le collega a pertinenti pagine di wikipedia. Il target della classificazione è rappresentato da
testi particolarmente brevi, nell'ordine dei 10-15 termini, un contesto dove il paradigma bag-of-words risulta poco efficace.
l'annotazione semantica di documenti fornita da TAGME, uno strumento che che individua termini significativi all'interno
di testi non strutturati e le collega a pertinenti pagine di wikipedia. Il target della classificazione è rappresentato da
testi particolarmente brevi, nell'ordine dei 10-15 termini, un contesto dove il paradigma bag-of-words risulta poco efficace.
File
Nome file | Dimensione |
---|---|
Frontespizio.pdf | 208.97 Kb |
1 file non consultabili su richiesta dell’autore. |