logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-11142023-151819


Thesis type
Tesi di laurea magistrale
Author
MARINELLI, ALBERTO ROBERTO
email address
a.marinelli9@studenti.unipi.it, albertorobertoemme@libero.it
URN
etd-11142023-151819
Thesis title
Updating knowledge in Large Language Models: an Empirical Evaluation
Department
INFORMATICA
Course of study
INFORMATICA
Supervisors
relatore Prof. Carta, Antonio
correlatore Prof.ssa Passaro, Lucia C.
controrelatore Prof. Zavattari, Cesare
Keywords
  • continual learning
  • large language models
Graduation session start date
01/12/2023
Availability
Full
Summary
I modelli linguistici pre-addestrati su testi provenienti da un'ampia varietà di fonti costituiscono la base dell'odierno NLP. Nonostante le loro performance, questi diventano obsoleti in un mondo in continua evoluzione in cui la risoluzione di compiti richiede informazioni aggiornate. Questo problema deriva dai metodi con cui i LM vengono addestrati, in particolare utilizzando esclusivamente un dataset fisso ad un arco temporale. In questo lavoro si valuta l'adattabilità dei LM a corpus di conoscenza frequentemente aggiornati come Wikipedia, in particolare utilizzando tecniche di Continual Learning che permettono di continuare la fase di addestramento, bilanciando tra dati pregressi e informazioni fattuali recenti.
File