logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-01042018-113746


Tipo di tesi
Tesi di laurea magistrale
Autore
TORTORELLI, MARIA CRISTINA
URN
etd-01042018-113746
Titolo
Analisi linguistica di commenti ai post delle pagine Facebook dei Ministri della Repubblica Italiana
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Relatori
relatore Prof. Tavosanis, Mirko
Parole chiave
  • API Facebook
  • commenti
  • Facebook
  • italiano popolare
  • linguistica
  • politica
  • post
  • sub-standard
Data inizio appello
05/02/2018
Consultabilità
Completa
Riassunto
Questo lavoro di tesi magistrale si propone di osservare e analizzare i tratti linguistici dei commenti ai post delle pagine Facebook dei Ministri della Repubblica Italiana. Nel marzo 2017 ho individuato quali ministri del governo Gentiloni avessero delle pagine Facebook attive e tramite uno scraper ho estratto migliaia di commenti degli utenti da diversi post. Lo scraper utilizzato è uno script in linguaggio Python che utilizza le API di Facebook e il suo social graph per estrarre automaticamente post, commenti e reazioni. Una volta ottenuto un corpus di circa 263.000 token raccolti da 14 diverse pagine Facebook, ho effettuato un’indagine a campione su 100 utenti per individuare la demografia degli autori occasionali e degli autori ricorrenti. Quest’operazione mi ha permesso di ricostruire una sorta di scheda anagrafica di chi commenta sporadicamente le pagine dei ministri e di chi le commenta spesso. Dopo una pulizia del corpus volta all’eliminazione dei commenti ripetuti, ho analizzato il corpus con Read-IT, uno strumento di annotazione linguistica progettato dal CNR di Pisa. Ho osservato sia il profilo lessicale sia il profilo sintattico. La distribuzione delle parti del discorso utilizzate e la densità lessicale avvicinano molto il corpus estratto dai commenti di Facebook ai dati estratti da un corpus di parlato. Successivamente, mi sono concentrata sull’analisi delle frasi relative e in particolar modo delle relative non-standard all’interno del corpus, osservando i fenomeni di sovraestensione del che e del dove, tratti sub-standard molto frequenti nel parlato. Infine, ho selezionato casualmente dal corpus un campione di 100 commenti per cercare all’interno le occorrenze di tratti neo-standard e sub-standard.
File