Tesi etd-01182018-181051

Tipo di tesi

Tesi di laurea magistrale

URN

etd-01182018-181051

Titolo

Strategie di rappresentazione di documenti mediante Word Embedding nei task di Sentiment Analysis

Dipartimento

FILOLOGIA, LETTERATURA E LINGUISTICA

Corso di studi

INFORMATICA UMANISTICA

Relatori

.

relatore Dott. Dell'Orletta, Felice

Parole chiave

Irony Detection
Natural Language Processing
Polarity Classification
Semantica Distribuzionale
Sentiment Analysis
Subjectivity Classification
Word Embedding

Data inizio appello

05/02/2018

Consultabilità

Completa

Riassunto (Inglese)

Riassunto (Italiano)

Il presente elaborato propone uno studio sulle strategie di rappresentazione dei documenti mediante Word Embedding nei compiti di Sentiment Analysis. Dopo un excursus storico-teorico, nella relazione vengono descritti i risultati di una grande quantità di esperimenti condotti per rispondere alle seguenti domande di ricerca:
- quale effetto ha la dimensione del corpus dal quale si producono i word embedding sull'accuratezza del sistema di sentiment analysis?
- quale impatto si ha usando word embedding estratti a partire da un corpus dello stesso genere (testi pubblicati su Twitter) di quello in seguito analizzato dal sistema di sentiment analysis, rispetto a embedding estratti da testi generici?
- quale approccio per la creazione degli embedding (basato su parole o su n-grammi di caratteri) è più efficace nella sentiment analysis?
- qual'è la migliore strategia di combinazione dei word embedding per rappresentare il testo all'interno di sistemi di sentiment analysis?
- quale impatto ha l'uso dei word embedding delle diverse categorie grammaticali sull'accuratezza del sistema di sentiment analysis?

File

Nome file	Dimensione
tesi_rug...itiva.pdf	4.67 Mb
Contatta l’autore

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-01182018-181051