logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-01182018-181051


Thesis type
Tesi di laurea magistrale
Author
PETROLITO, RUGGERO
URN
etd-01182018-181051
Thesis title
Strategie di rappresentazione di documenti mediante Word Embedding nei task di Sentiment Analysis
Department
FILOLOGIA, LETTERATURA E LINGUISTICA
Course of study
INFORMATICA UMANISTICA
Supervisors
relatore Dott. Dell'Orletta, Felice
Keywords
  • Word Embedding
  • Sentiment Analysis
  • Subjectivity Classification
  • Polarity Classification
  • Semantica Distribuzionale
  • Natural Language Processing
  • Irony Detection
Graduation session start date
05/02/2018
Availability
Full
Summary
Il presente elaborato propone uno studio sulle strategie di rappresentazione dei documenti mediante Word Embedding nei compiti di Sentiment Analysis. Dopo un excursus storico-teorico, nella relazione vengono descritti i risultati di una grande quantità di esperimenti condotti per rispondere alle seguenti domande di ricerca:
- quale effetto ha la dimensione del corpus dal quale si producono i word embedding sull'accuratezza del sistema di sentiment analysis?
- quale impatto si ha usando word embedding estratti a partire da un corpus dello stesso genere (testi pubblicati su Twitter) di quello in seguito analizzato dal sistema di sentiment analysis, rispetto a embedding estratti da testi generici?
- quale approccio per la creazione degli embedding (basato su parole o su n-grammi di caratteri) è più efficace nella sentiment analysis?
- qual'è la migliore strategia di combinazione dei word embedding per rappresentare il testo all'interno di sistemi di sentiment analysis?
- quale impatto ha l'uso dei word embedding delle diverse categorie grammaticali sull'accuratezza del sistema di sentiment analysis?
File