logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-06252024-203602


Tipo di tesi
Tesi di dottorato di ricerca
Autore
PEDINOTTI, PAOLO
URN
etd-06252024-203602
Titolo
Computational Models of Enriched Compositionality
Settore scientifico disciplinare
L-LIN/01
Corso di studi
DISCIPLINE LINGUISTICHE E LETTERATURE STRANIERE
Relatori
tutor Prof. Lenci, Alessandro
Parole chiave
  • Bayesian inference
  • Computational linguistics
  • Language Models
  • Linguistica computazionale
Data inizio appello
05/07/2024
Consultabilità
Non consultabile
Data di rilascio
05/07/2064
Riassunto
La tesi intende approfondire come modelli computazionali (modelli di NLP "tradizionale", Language Models, Language Models arricchiti con inferenza bayesiana sullo stile del modello di pragmatica formale RSA) siano in grado di simulare il comportamento umano per quanto riguarda un aspetto importante del modo in cui elaboriamo il significato di espressioni, ossia l'arricchimento del significato letterale con informazione implicita. Verranno prese in considerazione diversi tipi di espressioni che presentano questa caratteristica (metafore, metonimie, implicature): questi datasets saranno utilizzati per indagini di tipo linguistico e per analizzare il comportamento di modelli computazionali (e in particolare dei Language models). La parte finale della tesi è mirata a comprendere come certi limiti che emergono dall'analisi dei Language Models possano essere superati creando agenti che si basano su Language Models e inferenza bayesiana.

The thesis aims to explore how computational models ("traditional" natural language processing models, language models, and language models enriched with Bayesian inference in the style of the RSA formal pragmatics model) can simulate human behavior concerning an important aspect of how we process the meaning of expressions, namely, the enrichment of literal meaning with implicit information (enriched compositionality). Various types of expressions that exhibit this feature (metaphors, metonymies, implicatures) will be considered: these datasets will be used for linguistic investigations and to analyze the behavior of computational models (particularly Language Models). The final part of the thesis focuses on understanding how certain limitations that emerge from the analysis of language models can be overcome by creating agents based on Language Models and Bayesian inference.

File