logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-01182018-181051


Tipo di tesi
Tesi di laurea magistrale
Autore
PETROLITO, RUGGERO
URN
etd-01182018-181051
Titolo
Strategie di rappresentazione di documenti mediante Word Embedding nei task di Sentiment Analysis
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Relatori
relatore Dott. Dell'Orletta, Felice
Parole chiave
  • Irony Detection
  • Natural Language Processing
  • Polarity Classification
  • Semantica Distribuzionale
  • Sentiment Analysis
  • Subjectivity Classification
  • Word Embedding
Data inizio appello
05/02/2018
Consultabilità
Completa
Riassunto
Il presente elaborato propone uno studio sulle strategie di rappresentazione dei documenti mediante Word Embedding nei compiti di Sentiment Analysis. Dopo un excursus storico-teorico, nella relazione vengono descritti i risultati di una grande quantità di esperimenti condotti per rispondere alle seguenti domande di ricerca:
- quale effetto ha la dimensione del corpus dal quale si producono i word embedding sull'accuratezza del sistema di sentiment analysis?
- quale impatto si ha usando word embedding estratti a partire da un corpus dello stesso genere (testi pubblicati su Twitter) di quello in seguito analizzato dal sistema di sentiment analysis, rispetto a embedding estratti da testi generici?
- quale approccio per la creazione degli embedding (basato su parole o su n-grammi di caratteri) è più efficace nella sentiment analysis?
- qual'è la migliore strategia di combinazione dei word embedding per rappresentare il testo all'interno di sistemi di sentiment analysis?
- quale impatto ha l'uso dei word embedding delle diverse categorie grammaticali sull'accuratezza del sistema di sentiment analysis?
File