logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-10012025-103109


Tipo di tesi
Tesi di laurea magistrale
Autore
ONESTO, GIUSEPPE
URN
etd-10012025-103109
Titolo
Classificazione dell'ideologia politica di testi di Online Social Network sul modello multidimensionale Political Compass
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof.ssa Pollacci, Laura
relatore Dott. Failla, Andrea
Parole chiave
  • machine learning
  • political compass
  • political text.
  • Reddit
  • text categorization
  • text classification
Data inizio appello
17/10/2025
Consultabilità
Non consultabile
Data di rilascio
17/10/2028
Riassunto
Il presente lavoro di tesi si focalizza sulla classificazione automatica dell'ideologia politica in testi estratti da Online Social Network. Utilizzando un approccio di apprendimento supervisionato, la ricerca mira a determinare l'orientamento politico sulle due dimensioni del Political Compass: quella economica e quella sociale.
Per la creazione di un dataset di ground truth, si sviluppa una metodologia che combina le autodichiarazioni ideologiche degli utenti di Reddit con la classificazione dei testi operata da un Large Language Model (LLM).
A partire da questo dataset, si sviluppano e confrontano diversi modelli di Machine Learning, istruiti su feature appositamente progettate per le peculiarità dei testi dei social network e per gli attributi specifici dell'ideologia politica. L'efficacia di tali modelli viene confrontata con le performance di un modello Transformer.

This thesis focuses on the automatic classification of political ideology in texts extracted from Online Social Networks. Using a supervised learning approach, the research aims to determine political orientation across both dimensions of the Political Compass: the economic and the social.
For the creation of a ground truth dataset, a methodology is developed that combines the ideological self-declarations of Reddit users with text classification performed by a Large Language Model (LLM). Starting from this dataset, several Machine Learning models are developed and compared. These models are trained on features specifically engineered for the unique characteristics of social network texts and for attributes specific to political ideology. The effectiveness of these models is then compared against the performance of a Transformer model.
File