Tesi etd-05082021-110508

Tipo di tesi

Tesi di laurea magistrale

Autore

LOMBARDI, AGNESE

URN

etd-05082021-110508

Titolo

Agentivita e telicita nel modello distribuzionale GilBERTo e implicazioni cognitive

Dipartimento

FILOLOGIA, LETTERATURA E LINGUISTICA

Corso di studi

LINGUISTICA E TRADUZIONE

Relatori

relatore Prof. Lenci, Alessandro

Parole chiave

agentivity
distributional semantics
GilBERTo
telicity

Data inizio appello

28/05/2021

Consultabilità

Non consultabile

Data di rilascio

28/05/2091

Riassunto

L’obiettivo di questo studio è quello di indagare se modelli computazionali
distribuzionali del linguaggio riescono ad inferire proprietà di lexical semantics
(semantica di interfaccia) e utilizzare queste informazioni per il completamento di task
morfosintattici.
L’ipotesi distribuzionale stabilisce che la similarità tra due parole è direttamente
correlata alla similarità dei contesti in cui queste occorrono. Conseguentemente, la
similarità è misurata attraverso statistiche di distribuzione di co-occorrenza nei testi e
due parole sono considerate più semanticamente simili quanto più occorrono in contesti
simili. Dal punto di vista pratico l’ipotesi distribuzionale si esprime attraverso modelli
computazionali che rappresentano spazi semantici. Uno degli aspetti più vantaggiosi di
questi modelli, in particolar modo per il nostro lavoro, è che forniscono rappresentazioni
del linguaggio distribuite e scalari. Questo perché l’informazione è trasmessa attraverso
il valore continuo delle dimensioni vettoriali.
Questo aspetto li rende ottimi strumenti di indagine per la lexical semantics, ad esempio,
perché queste proprietà sono concepite come un continuum: un asse ai cui estremi
opposti si trovano i membri più prototipici e quelli meno prototipici.
Le proprietà di lexical semantics che abbiamo considerato sono la telicità (anche in
relazione all’individuazione) e l’agentività. Entrambe queste proprietà semantiche
agiscono nell’interfaccia tra semantica e morfosintassi: sono semanticamente
determinate, ma sintatticamente codificate. Sarà dunque possibile indagarne l’inferenza
da parte del modello attraverso opportuni task morfosintattici (ad esempio i verbi
inerentemente telici occorrono solo con “in x tempo”, mentre gli inerentemente atelici
con “per x tempo”).
Da un punto di vista pratico i task sottoposti al modello saranno di tipo predittivo e il
modello dovrà completare la frase con la parola mancante: il modello restituisce insieme
alle opzioni di completamento delle probabilità per ogni opzione.
Gli stessi task del modello verranno sottoposti ai parlanti e la comparazione tra i due
gruppi di dati ci permetterà di determinare se questi modelli distribuzionali possono
essere considerati anche dei modelli cognitivi del processamento del linguaggio
(limitatamente per le proprietà indagate). Inoltre, potremo anche ricavare informazioni sul modo in cui i parlanti inferiscono e processano la lexical semantics e determinare se
questo processamento avviene in maniera distribuzionale.
Futuri lavori potranno indagare altre proprietà di lexical semantics in questi modelli: ad
esempio potrebbe essere interessante condurre un lavoro sull’intransitività scissa.
Infatti, molte ricerche stabiliscono che l’intransitività scissa è un fenomeno
morfosintattico crosslinguistico che dipende dal comportamento semantico (qualcuno
ipotizza dall’azione congiunta di telicità e agentività).
Questo tipo di indagine è vantaggioso non solo per approfondire quali proprietà
linguistiche sono codificate dai vettori in modelli distribuzionali, ma anche per testare le
teorie linguistiche più in generale.
Inoltre, il nostro lavoro può essere migliorato con lo studio dell’aspetto del verbo e
dell’influenza che questo ha nell’interpretazione della frase.
Ovviamente, questo studio costituisce anche un progresso nella ricerca sulle relazioni
tra modelli distribuzionali e processamento del linguaggio naturale.

File

Nome file	Dimensione
Tesi non consultabile. Contatta l’autore

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-05082021-110508