Thesis etd-01182018-181051 |
Link copiato negli appunti
Thesis type
Tesi di laurea magistrale
Author
PETROLITO, RUGGERO
URN
etd-01182018-181051
Thesis title
Strategie di rappresentazione di documenti mediante Word Embedding nei task di Sentiment Analysis
Department
FILOLOGIA, LETTERATURA E LINGUISTICA
Course of study
INFORMATICA UMANISTICA
Supervisors
relatore Dott. Dell'Orletta, Felice
Keywords
- Word Embedding
- Sentiment Analysis
- Subjectivity Classification
- Polarity Classification
- Semantica Distribuzionale
- Natural Language Processing
- Irony Detection
Graduation session start date
05/02/2018
Availability
Full
Summary
Il presente elaborato propone uno studio sulle strategie di rappresentazione dei documenti mediante Word Embedding nei compiti di Sentiment Analysis. Dopo un excursus storico-teorico, nella relazione vengono descritti i risultati di una grande quantità di esperimenti condotti per rispondere alle seguenti domande di ricerca:
- quale effetto ha la dimensione del corpus dal quale si producono i word embedding sull'accuratezza del sistema di sentiment analysis?
- quale impatto si ha usando word embedding estratti a partire da un corpus dello stesso genere (testi pubblicati su Twitter) di quello in seguito analizzato dal sistema di sentiment analysis, rispetto a embedding estratti da testi generici?
- quale approccio per la creazione degli embedding (basato su parole o su n-grammi di caratteri) è più efficace nella sentiment analysis?
- qual'è la migliore strategia di combinazione dei word embedding per rappresentare il testo all'interno di sistemi di sentiment analysis?
- quale impatto ha l'uso dei word embedding delle diverse categorie grammaticali sull'accuratezza del sistema di sentiment analysis?
- quale effetto ha la dimensione del corpus dal quale si producono i word embedding sull'accuratezza del sistema di sentiment analysis?
- quale impatto si ha usando word embedding estratti a partire da un corpus dello stesso genere (testi pubblicati su Twitter) di quello in seguito analizzato dal sistema di sentiment analysis, rispetto a embedding estratti da testi generici?
- quale approccio per la creazione degli embedding (basato su parole o su n-grammi di caratteri) è più efficace nella sentiment analysis?
- qual'è la migliore strategia di combinazione dei word embedding per rappresentare il testo all'interno di sistemi di sentiment analysis?
- quale impatto ha l'uso dei word embedding delle diverse categorie grammaticali sull'accuratezza del sistema di sentiment analysis?
File
Nome file | Dimensione |
---|---|
tesi_rug...itiva.pdf | 4.67 Mb |
Contatta l’autore |