logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-06252024-203602


Thesis type
Tesi di dottorato di ricerca
Author
PEDINOTTI, PAOLO
URN
etd-06252024-203602
Thesis title
Computational Models of Enriched Compositionality
Academic discipline
L-LIN/01
Course of study
DISCIPLINE LINGUISTICHE E LETTERATURE STRANIERE
Supervisors
tutor Prof. Lenci, Alessandro
Keywords
  • Bayesian inference
  • Computational linguistics
  • Language Models
  • Linguistica computazionale
Graduation session start date
05/07/2024
Availability
Withheld
Release date
05/07/2064
Summary
La tesi intende approfondire come modelli computazionali (modelli di NLP "tradizionale", Language Models, Language Models arricchiti con inferenza bayesiana sullo stile del modello di pragmatica formale RSA) siano in grado di simulare il comportamento umano per quanto riguarda un aspetto importante del modo in cui elaboriamo il significato di espressioni, ossia l'arricchimento del significato letterale con informazione implicita. Verranno prese in considerazione diversi tipi di espressioni che presentano questa caratteristica (metafore, metonimie, implicature): questi datasets saranno utilizzati per indagini di tipo linguistico e per analizzare il comportamento di modelli computazionali (e in particolare dei Language models). La parte finale della tesi è mirata a comprendere come certi limiti che emergono dall'analisi dei Language Models possano essere superati creando agenti che si basano su Language Models e inferenza bayesiana.

The thesis aims to explore how computational models ("traditional" natural language processing models, language models, and language models enriched with Bayesian inference in the style of the RSA formal pragmatics model) can simulate human behavior concerning an important aspect of how we process the meaning of expressions, namely, the enrichment of literal meaning with implicit information (enriched compositionality). Various types of expressions that exhibit this feature (metaphors, metonymies, implicatures) will be considered: these datasets will be used for linguistic investigations and to analyze the behavior of computational models (particularly Language Models). The final part of the thesis focuses on understanding how certain limitations that emerge from the analysis of language models can be overcome by creating agents based on Language Models and Bayesian inference.

File