logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-05082021-110508


Tipo di tesi
Tesi di laurea magistrale
Autore
LOMBARDI, AGNESE
URN
etd-05082021-110508
Titolo
Agentivita e telicita nel modello distribuzionale GilBERTo e implicazioni cognitive
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
LINGUISTICA E TRADUZIONE
Relatori
relatore Prof. Lenci, Alessandro
Parole chiave
  • agentivity
  • distributional semantics
  • GilBERTo
  • telicity
Data inizio appello
28/05/2021
Consultabilità
Non consultabile
Data di rilascio
28/05/2091
Riassunto
L’obiettivo di questo studio è quello di indagare se modelli computazionali
distribuzionali del linguaggio riescono ad inferire proprietà di lexical semantics
(semantica di interfaccia) e utilizzare queste informazioni per il completamento di task
morfosintattici.
L’ipotesi distribuzionale stabilisce che la similarità tra due parole è direttamente
correlata alla similarità dei contesti in cui queste occorrono. Conseguentemente, la
similarità è misurata attraverso statistiche di distribuzione di co-occorrenza nei testi e
due parole sono considerate più semanticamente simili quanto più occorrono in contesti
simili. Dal punto di vista pratico l’ipotesi distribuzionale si esprime attraverso modelli
computazionali che rappresentano spazi semantici. Uno degli aspetti più vantaggiosi di
questi modelli, in particolar modo per il nostro lavoro, è che forniscono rappresentazioni
del linguaggio distribuite e scalari. Questo perché l’informazione è trasmessa attraverso
il valore continuo delle dimensioni vettoriali.
Questo aspetto li rende ottimi strumenti di indagine per la lexical semantics, ad esempio,
perché queste proprietà sono concepite come un continuum: un asse ai cui estremi
opposti si trovano i membri più prototipici e quelli meno prototipici.
Le proprietà di lexical semantics che abbiamo considerato sono la telicità (anche in
relazione all’individuazione) e l’agentività. Entrambe queste proprietà semantiche
agiscono nell’interfaccia tra semantica e morfosintassi: sono semanticamente
determinate, ma sintatticamente codificate. Sarà dunque possibile indagarne l’inferenza
da parte del modello attraverso opportuni task morfosintattici (ad esempio i verbi
inerentemente telici occorrono solo con “in x tempo”, mentre gli inerentemente atelici
con “per x tempo”).
Da un punto di vista pratico i task sottoposti al modello saranno di tipo predittivo e il
modello dovrà completare la frase con la parola mancante: il modello restituisce insieme
alle opzioni di completamento delle probabilità per ogni opzione.
Gli stessi task del modello verranno sottoposti ai parlanti e la comparazione tra i due
gruppi di dati ci permetterà di determinare se questi modelli distribuzionali possono
essere considerati anche dei modelli cognitivi del processamento del linguaggio
(limitatamente per le proprietà indagate). Inoltre, potremo anche ricavare informazioni sul modo in cui i parlanti inferiscono e processano la lexical semantics e determinare se
questo processamento avviene in maniera distribuzionale.
Futuri lavori potranno indagare altre proprietà di lexical semantics in questi modelli: ad
esempio potrebbe essere interessante condurre un lavoro sull’intransitività scissa.
Infatti, molte ricerche stabiliscono che l’intransitività scissa è un fenomeno
morfosintattico crosslinguistico che dipende dal comportamento semantico (qualcuno
ipotizza dall’azione congiunta di telicità e agentività).
Questo tipo di indagine è vantaggioso non solo per approfondire quali proprietà
linguistiche sono codificate dai vettori in modelli distribuzionali, ma anche per testare le
teorie linguistiche più in generale.
Inoltre, il nostro lavoro può essere migliorato con lo studio dell’aspetto del verbo e
dell’influenza che questo ha nell’interpretazione della frase.
Ovviamente, questo studio costituisce anche un progresso nella ricerca sulle relazioni
tra modelli distribuzionali e processamento del linguaggio naturale.
File