ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-06292020-182951

Tipo di tesi

Tesi di laurea magistrale

URN

etd-06292020-182951

Titolo

Applicazione del modello distribuzionale alla rappresentazione a esemplari del significato derivazionale: il caso dei nomi d'azione in -ATA, -ZIONE e -MENTO

Dipartimento

FILOLOGIA, LETTERATURA E LINGUISTICA

Corso di studi

LINGUISTICA E TRADUZIONE

Parole chiave

distributional semantics
exemplar model
morphology
morphosemantics
semantics
suffixation
t-sne
vector offsets

Data inizio appello

13/07/2020

Consultabilità

Non consultabile

Data di rilascio

13/07/2090

Riassunto (Inglese)

Riassunto (Italiano)

L’indagine ha lo scopo di fornire un’alternativa alla tradizionale analisi descrittiva delle formazioni nominali suffissate, adottando una rappresentazione del significato derivazionale a esemplari (RaE) così come proposto da Bybee & Eddington (2006) e Bybee (2010). Si tratta di un approccio usage-based che considera le combinazioni tra basi e suffissi, definite all’interno di costruzioni morfologiche, come frutto di un processo di categorizzazione basata sul grado di similarità semantica con gli elementi lessicali già immagazzinati nella memoria linguistica, ovvero di cui il singolo parlante/ascoltatore ha fatto esperienza trattenendo ogni dettaglio di ciascuna istanza d’uso.
Secondo questo modello cognitivo del significato, le formazioni, legate da un rapporto più o meno stretto di similarità semantica e organizzate intorno alla formazione più frequente, si costituiscono in categorie concettuali tramite il meccanismo cognitivo dell’analogia semantica. In queste categorie, è possibile identificare alcune formazioni come più centrali e altre più marginali: ogni formazione è considerata un esemplare, ossia una rappresentazione mentale costituita dall’insieme delle istanze e dei dettagli provenienti dall’esperienza linguistica che l’utente accumula per la singola parola.
La risultante rappresentazione è stata poi comprovata sperimentalmente, applicando il modello distribuzionale del significato (Lenci, 2008) in due fasi.
Dapprima, è stata testata la bontà dei diversi cluster e la loro coerenza interna in termini di stabilità dei contrasti semantici e sintattici all’interno della relazione morfologica (Bonami & Paperno, 2018), ovvero attuando una comparazione delle regolarità semantiche e sintattiche tra i vari raggruppamenti che è ipotizzata più stabile nei raggruppamenti individuati dalla RaE. Per questa analisi, la metodica scelta è stata quella dei vector offsets (Bonami & Paperno, 2018), che consiste in una “operational definition of contrasts between words as offset vectors in a distributional vector space of the kind familiar from distributional semantics” (ivi, pag. 1).
Successivamente, l’analisi è stata indirizzata verso due dimensioni differenti: da un lato, l’articolazione analogica della complessità semantica di –ATA, dall’altro la caratterizzazione della rivalità morfosemantica tra –ZIONE e –MENTO (Bonami & Thuilier, 2018). Per entrambe, è stato impiegato l’algoritmo per la visualizzazione dei dati t-SNE (van der Maaten & Hinton, 2008), ampiamente utilizzato in machine learning in quanto basato su una tecnica di riduzione della dimensionalità non lineare: in altre parole, permette di ridurre lo spazio dimensionale di dati con centinaia o migliaia di dimensioni a sole due o più dimensioni, garantendo e preservando la distanza originaria dei punti all’interno dello spazio.
I risultati sperimentali ottenuti da entrambe le analisi computazionali hanno fatto emergere prove sostanziali per una rappresentazione del significato ad esemplari emersa dei tre suffissi, fornendo così spunti di ricerca e nuove intuizioni da indagare.

File

Nome file	Dimensione
Tesi non consultabile. Contatta l’autore