logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-07062024-164632


Tipo di tesi
Tesi di laurea magistrale
Autore
GIORGI, TOMMASO
Indirizzo email
t.giorgi@studenti.unipi.it, giorgi.tommaso98@gmail.com
URN
etd-07062024-164632
Titolo
Analyzing and Replicating Biases in Hate Speech Annotations: A Human and AI Perspective
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
COMPUTER ENGINEERING
Relatori
relatore Prof. Avvenuti, Marco
relatore Ing. Cima, Lorenzo
relatore Dott. Fagni, Tiziano
Parole chiave
  • AI
  • biases
  • hate speech
  • Large Language Models
  • LLM
  • machine learning
  • moderation
  • social network
Data inizio appello
26/07/2024
Consultabilità
Completa
Riassunto
In questa tesi andiamo ad analizzare un dataset molto grande di commenti di odio estrapolati da diversi social network che sono stati annotati da annotatori con un background molto diverso tra loro. Nella prima fase ci occupiamo di verificare eventuali bias presenti nel dataset sfruttando le diverse informazioni in esso presenti. Successivamente andiamo a replicare queste annotazioni usando i Large Language model con l'obiettivo di verificare se anche essi presentano dei bias e in particolare se riproducono gli stessi bias osservati per gli annotatori umani. Scopo di questa ricerca è valutare se gli LLM possono essere usati o meno in alcuni task di annotazione e in particolare anche nell'ambito della moderazione.

In this thesis, we analyze a large dataset of hate comments extracted from various social networks, annotated by individuals from diverse backgrounds. In the first phase, we investigate potential biases in the dataset using the diverse information it contains. Next, we replicate these annotations using Large Language Models to determine if they also exhibit biases, specifically whether they replicate the biases observed in human annotators. The goal of this research is to assess whether LLMs can be effectively used for certain annotation tasks, particularly in the context of moderation.
File