logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-10252021-161435


Tipo di tesi
Tesi di laurea magistrale
Autore
FRANCHINI, GIANMARCO
URN
etd-10252021-161435
Titolo
Creazione di un corpus italiano annotato per negazione e speculazione e addestramento di modelli per il loro riconoscimento
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Relatori
relatore Prof. Attardi, Giuseppe
Parole chiave
  • corpus
  • computational linguistics
  • transfer learning
  • machine learning
  • bert
  • negazione
  • speculazione
  • linguistica computazionale
  • negation
  • speculation
  • nlp
Data inizio appello
15/11/2021
Consultabilità
Tesi non consultabile
Riassunto
(English below)
A partire dalla letteratura linguistico-teorica disponibile sull'argomento, le definizioni di negazione e speculazione, e quindi di cue e scope (portata) negativi e speculativi, vengono discusse e presentate in chiave critica. Vengono quindi elaborate delle linee guida per la loro annotazione in italiano, impiegate per la creazione di un nuovo corpus. Il corpus, tratto dai resoconti stenografici delle sedute della Camera del Parlamento italiano, viene presentato e analizzato. In chiusura, viene proposta un'architettura neurale basata su BERT per le task della cue detection e della scope resolution, sia della negazione, sia della speculazione. I risultati ottenuti con questa architettura, particolarmente buoni nel caso della negazione, sono presentati e discussi.

Based on the relevant theoretical literature, the definitions of negation and speculation, as well as negative and speculative cue and scope, are discussed and critically put forward. Guidelines for their annotation in Italian are then drafted and put to use for the creation of a new corpus. This corpus, built upon the debate transcripts of the Chamber of the Italian Parliament, is presented and analysed. Finally, a neural architecture based on BERT is proposed for negative and speculative cue detection and scope resolution. The results obtained with said architecture, particularly good for negation, are presented and discussed.
File