ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-08122020-103815


Tipo di tesi
Tesi di laurea magistrale
Autore
DELL'OGLIO, PIETRO
URN
etd-08122020-103815
Titolo
Creazione e analisi computazionale di un corpus di fake news
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Relatori
relatore Lenci, Alessandro
Parole chiave
  • fakenewsdetection
  • fakenews
  • naturallanguageprocessing
  • deeplearning
  • dataannotation
Data inizio appello
28/09/2020
Consultabilità
Tesi non consultabile
Riassunto
Il problema del riconoscimento automatico delle Fake News sta diventando un topic di ricerca sempre più diffuso in numerosi campi. L’obiettivo della tesi è quello di presentare una metodologia per la costruzione di un corpus di fake news attraverso l’annotazione in crowdsourcing e di sfruttarla per la costruzione di un corpus. Per questo progetto ci siamo limitati a un unico evento, l’incendio della Cattedrale di Notre Dame nell’aprile 2019. Abbiamo progettato un task in cui è stato chiesto ai partecipanti di annotare un articolo o un tweet come Fake o Real sulla base di un contesto. Dopo le analisi di Inter-Annotator Agreement per calcolare l’affidabilità del corpus (rinominato momentaneamente NotreDame_Dataset), questo è stato utilizzato per addestrare alcuni modelli computazionali (CNN, BiLSTM e Bert) e per operare un confronto con altri due dataset attualmente allo stato dell’arte, LIAR e Fake- NewsNet, in modo da poter verificare l’attuale comportamento del NotreDame_Dataset.
File