logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-04302015-171419


Tipo di tesi
Tesi di dottorato di ricerca
Autore
BENOTTO, GIULIA
URN
etd-04302015-171419
Titolo
Distributional Models for Semantic Relations: A Sudy on Hyponymy and Antonymy
Settore scientifico disciplinare
L-LIN/01
Corso di studi
DISCIPLINE UMANISTICHE
Relatori
tutor Prof. Lenci, Alessandro
tutor Prof.ssa Bertuccelli Papi, Marcella
Parole chiave
  • distributional semantics
  • semantics
  • relation extraction
  • distributional methods
  • semantica distribuzionale
  • estrazione di relazioni
Data inizio appello
02/06/2015
Consultabilità
Completa
Riassunto

The overall purpose of this research project is to study and explore the potential and limitations of the distributional approach with respect to lexical semantics.
Analyzing paradigmatic relations such as synonymy, antonymy, hypernymy, hyponymy and co-hyponymy while using distributional methods could be very interesting and really challenging. For instance, state of the art semantic distributional methods have difficulties in distinguishing these relations. This is because these relations tend to distribute, within the texts, in a very similar way. We first carried out a study about current state of the art distributional measures developed for the recognition of paradigmatic semantic relations, trying to assess the degree of success reported by such measures. We then used the data we gathered to develop new distributional measures apt to classify the hyponymy/hypernymy relation and the antonymy relation.
Not only did we prove that distributional methods can indeed be used in order to classify, in a non-supervised way, these relations; we also developed measures, especially conceived for recognizing and classifying hypernymy and antonymy, that performs better than state of the art ones.


L'obiettivo generale di questo progetto di ricerca è quello di studiare ed esplorare le potenzialità e i limiti dell'approccio distribuzionale rispetto alla semantica lessicale.
Utilizzare metodi basati sull’approccio distribuzionale per l’analisi delle relazioni semantiche paradigmatiche (come sinonimia, antonimia, iperonimia, iponimia e co-iponimia) potrebbe rivelarsi molto complesso e al contempo molto interessante, per varie ragioni. Ad esempio, le attuali misure allo stato dell'arte basate sull’approccio distribuzionale hanno difficoltà nel distinguere queste relazioni. Questo perché queste relazioni tendono a distribuirsi, all'interno dei testi, in un modo molto simile l’una all’altra.
In primo luogo abbiamo quindi condotto uno studio sulle misure distribuzionali sviluppate per il riconoscimento delle relazioni semantiche paradigmatiche attualmente allo stato dell’arte, cercando di valutare il grado di successo riportato da tali misure. Abbiamo poi utilizzato i dati raccolti allo scopo di sviluppare nuove misure distribuzionali atte a classificare la relazione di iponimia / iperonimia e la relazione di antonimia.
In questo lavoro, non solo si riesce a dimostrare che con metodi distribuzionali è possibile classificare, in modo non supervisionato, relazioni semantiche paradigmatiche; ma sono anche state sviluppate misure distribuzionali studiate appositamente per il riconoscimento e la classificazione di iperonimia e antonimia, che danno risultato migliori di quelle allo stato dell'arte.

File