logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-08122020-103815


Tipo di tesi
Tesi di laurea magistrale
URN
etd-08122020-103815
Titolo
Creazione e analisi computazionale di un corpus di fake news
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Parole chiave
  • dataannotation
  • deeplearning
  • fakenews
  • fakenewsdetection
  • naturallanguageprocessing
Data inizio appello
28/09/2020
Consultabilità
Tesi non consultabile
Riassunto (Inglese)
Riassunto (Italiano)
Il problema del riconoscimento automatico delle Fake News sta diventando un topic di ricerca sempre più diffuso in numerosi campi. L’obiettivo della tesi è quello di presentare una metodologia per la costruzione di un corpus di fake news attraverso l’annotazione in crowdsourcing e di sfruttarla per la costruzione di un corpus. Per questo progetto ci siamo limitati a un unico evento, l’incendio della Cattedrale di Notre Dame nell’aprile 2019. Abbiamo progettato un task in cui è stato chiesto ai partecipanti di annotare un articolo o un tweet come Fake o Real sulla base di un contesto. Dopo le analisi di Inter-Annotator Agreement per calcolare l’affidabilità del corpus (rinominato momentaneamente NotreDame_Dataset), questo è stato utilizzato per addestrare alcuni modelli computazionali (CNN, BiLSTM e Bert) e per operare un confronto con altri due dataset attualmente allo stato dell’arte, LIAR e Fake- NewsNet, in modo da poter verificare l’attuale comportamento del NotreDame_Dataset.
File