Tesi etd-06072018-165349

Tipo di tesi

Tesi di laurea magistrale

URN

etd-06072018-165349

Titolo

Creazione di un corpus e primi esperimenti per l'identificazione automatica delle parti informative di un testo a supporto di un sistema di generazione di domande di comprensione.

Dipartimento

FILOLOGIA, LETTERATURA E LINGUISTICA

Corso di studi

INFORMATICA UMANISTICA

Relatori

.

relatore Dott. Dell'Orletta, Felice
correlatore Dott.ssa Brunato, Dominique

Parole chiave

Dataset per Reading Comprehension
Linguistica Computazionale
Question Answering
Trattamento Automatico del Linguaggio Naturale

Data inizio appello

02/07/2018

Consultabilità

Non consultabile

Data di rilascio

02/07/2088

Riassunto (Inglese)

Riassunto (Italiano)

Il lavoro si pone nell’ambito della costruzione di un corpus di reading comprehension e nella definizione di un metodo per identificare le parti informative di un testo. Il corpus è frutto di un lungo e accurato processo di analisi e annotazione manuale delle prove di comprensione elaborate da Invalsi. Tra gli obiettivi principali vi è stato quello di comprendere l’esistenza o meno di una corrispondenza lineare frase-domanda-risposta: cioè, capire se in una frase o in una sotto-porzione di essa fosse contenuta la risposta a una determinata domanda. Il tutto al fine di generare un corpus di addestramento a supporto di un sistema automatico di generazione di domande per la valutazione delle competenze di comprensione della lingua scritta. Per quanto riguarda la definizione del metodo di estrazione delle parti rilevanti, sono stati condotti degli esperimenti per valutare l'esistenza di una relazione significativa tra le caratteristiche linguistiche estratte dalle frasi e la probabilità che quest'ultime contengano la risposta a una possibile domanda. Infine è stato sviluppato un classificatore basato su Support Vector Machine per l'identificazione delle parti rilevanti del testo.

File

Nome file	Dimensione
La tesi non è consultabile. Contatta l’autore

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-06072018-165349