Tesi etd-06292020-182951 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea magistrale
Autore
PAOLINI, CHIARA
URN
etd-06292020-182951
Titolo
Applicazione del modello distribuzionale alla rappresentazione a esemplari del significato derivazionale: il caso dei nomi d'azione in -ATA, -ZIONE e -MENTO
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
LINGUISTICA E TRADUZIONE
Relatori
relatore Prof. Lenci, Alessandro
controrelatore Prof.ssa Marotta, Giovanna
controrelatore Prof.ssa Marotta, Giovanna
Parole chiave
- distributional semantics
- exemplar model
- morphology
- morphosemantics
- semantics
- suffixation
- t-sne
- vector offsets
Data inizio appello
13/07/2020
Consultabilità
Non consultabile
Data di rilascio
13/07/2090
Riassunto
L’indagine ha lo scopo di fornire un’alternativa alla tradizionale analisi descrittiva delle formazioni nominali suffissate, adottando una rappresentazione del significato derivazionale a esemplari (RaE) così come proposto da Bybee & Eddington (2006) e Bybee (2010). Si tratta di un approccio usage-based che considera le combinazioni tra basi e suffissi, definite all’interno di costruzioni morfologiche, come frutto di un processo di categorizzazione basata sul grado di similarità semantica con gli elementi lessicali già immagazzinati nella memoria linguistica, ovvero di cui il singolo parlante/ascoltatore ha fatto esperienza trattenendo ogni dettaglio di ciascuna istanza d’uso.
Secondo questo modello cognitivo del significato, le formazioni, legate da un rapporto più o meno stretto di similarità semantica e organizzate intorno alla formazione più frequente, si costituiscono in categorie concettuali tramite il meccanismo cognitivo dell’analogia semantica. In queste categorie, è possibile identificare alcune formazioni come più centrali e altre più marginali: ogni formazione è considerata un esemplare, ossia una rappresentazione mentale costituita dall’insieme delle istanze e dei dettagli provenienti dall’esperienza linguistica che l’utente accumula per la singola parola.
La risultante rappresentazione è stata poi comprovata sperimentalmente, applicando il modello distribuzionale del significato (Lenci, 2008) in due fasi.
Dapprima, è stata testata la bontà dei diversi cluster e la loro coerenza interna in termini di stabilità dei contrasti semantici e sintattici all’interno della relazione morfologica (Bonami & Paperno, 2018), ovvero attuando una comparazione delle regolarità semantiche e sintattiche tra i vari raggruppamenti che è ipotizzata più stabile nei raggruppamenti individuati dalla RaE. Per questa analisi, la metodica scelta è stata quella dei vector offsets (Bonami & Paperno, 2018), che consiste in una “operational definition of contrasts between words as offset vectors in a distributional vector space of the kind familiar from distributional semantics” (ivi, pag. 1).
Successivamente, l’analisi è stata indirizzata verso due dimensioni differenti: da un lato, l’articolazione analogica della complessità semantica di –ATA, dall’altro la caratterizzazione della rivalità morfosemantica tra –ZIONE e –MENTO (Bonami & Thuilier, 2018). Per entrambe, è stato impiegato l’algoritmo per la visualizzazione dei dati t-SNE (van der Maaten & Hinton, 2008), ampiamente utilizzato in machine learning in quanto basato su una tecnica di riduzione della dimensionalità non lineare: in altre parole, permette di ridurre lo spazio dimensionale di dati con centinaia o migliaia di dimensioni a sole due o più dimensioni, garantendo e preservando la distanza originaria dei punti all’interno dello spazio.
I risultati sperimentali ottenuti da entrambe le analisi computazionali hanno fatto emergere prove sostanziali per una rappresentazione del significato ad esemplari emersa dei tre suffissi, fornendo così spunti di ricerca e nuove intuizioni da indagare.
Secondo questo modello cognitivo del significato, le formazioni, legate da un rapporto più o meno stretto di similarità semantica e organizzate intorno alla formazione più frequente, si costituiscono in categorie concettuali tramite il meccanismo cognitivo dell’analogia semantica. In queste categorie, è possibile identificare alcune formazioni come più centrali e altre più marginali: ogni formazione è considerata un esemplare, ossia una rappresentazione mentale costituita dall’insieme delle istanze e dei dettagli provenienti dall’esperienza linguistica che l’utente accumula per la singola parola.
La risultante rappresentazione è stata poi comprovata sperimentalmente, applicando il modello distribuzionale del significato (Lenci, 2008) in due fasi.
Dapprima, è stata testata la bontà dei diversi cluster e la loro coerenza interna in termini di stabilità dei contrasti semantici e sintattici all’interno della relazione morfologica (Bonami & Paperno, 2018), ovvero attuando una comparazione delle regolarità semantiche e sintattiche tra i vari raggruppamenti che è ipotizzata più stabile nei raggruppamenti individuati dalla RaE. Per questa analisi, la metodica scelta è stata quella dei vector offsets (Bonami & Paperno, 2018), che consiste in una “operational definition of contrasts between words as offset vectors in a distributional vector space of the kind familiar from distributional semantics” (ivi, pag. 1).
Successivamente, l’analisi è stata indirizzata verso due dimensioni differenti: da un lato, l’articolazione analogica della complessità semantica di –ATA, dall’altro la caratterizzazione della rivalità morfosemantica tra –ZIONE e –MENTO (Bonami & Thuilier, 2018). Per entrambe, è stato impiegato l’algoritmo per la visualizzazione dei dati t-SNE (van der Maaten & Hinton, 2008), ampiamente utilizzato in machine learning in quanto basato su una tecnica di riduzione della dimensionalità non lineare: in altre parole, permette di ridurre lo spazio dimensionale di dati con centinaia o migliaia di dimensioni a sole due o più dimensioni, garantendo e preservando la distanza originaria dei punti all’interno dello spazio.
I risultati sperimentali ottenuti da entrambe le analisi computazionali hanno fatto emergere prove sostanziali per una rappresentazione del significato ad esemplari emersa dei tre suffissi, fornendo così spunti di ricerca e nuove intuizioni da indagare.
File
Nome file | Dimensione |
---|---|
Tesi non consultabile. |