Tesi etd-03262020-232844

Tipo di tesi

Tesi di laurea magistrale

URN

etd-03262020-232844

Titolo

Contributo allo sviluppo software del Vocabolario Dantesco Latino (VDL): un'applicazione per l'indagine lessicografica sul latino di Dante

Dipartimento

FILOLOGIA, LETTERATURA E LINGUISTICA

Corso di studi

INFORMATICA UMANISTICA

Relatori

relatore Prof. Casarosa, Vittore
correlatore Prof. Pontari, Paolo

Parole chiave

computational linguistics
Dante Alighieri
latin
latino
linguistic studies on Dante
linguistica computazionale
software development
studi linguistici su Dante
sviluppo software
vocabolario dantesco latino

Data inizio appello

27/04/2020

Consultabilità

Tesi non consultabile

Riassunto (Inglese)

Riassunto (Italiano)

In questo elaborato viene descritto il contributo personale al progetto finalizzato allo sviluppo software del VDL (Vocabolario Dantesco Latino), un progetto attualmente in corso d’opera, che mira a costruire il primo strumento lessicografico dedicato alla lingua latina di Dante, liberamente accessibile sul web nel Portale dedicato al progetto.

È previsto che il VDL contenga una selezione di occorrenze, ossia attestazioni dei lemmi latini danteschi nelle opere in latino di altri autori, classici e medievali. Per questo i redattori/utilizzatori hanno richiesto uno strumento per l’estrazione di “occorrenze linguistiche”. In questo modo sarà possibile studiare se e come i precedenti autori latini hanno influenzato il latino di Dante, e se e come Dante può avere influenzato autori latini successivi.

Per soddisfare la richiesta è stata progettata e messa a punto un’API (VDL-Corpus Corporum) che interroga simultaneamente tutti i corpora presenti in Corpus Corporum, il sito scelto come base di dati di riferimento, alla ricerca delle occorrenze del lemma, nei testi danteschi con in altri testi latini, accettando in input il lemma latino cercato, supportando la ricerca di tutte le forme lemmatizzate, e fornendo come risultato un elenco di occorrenze, che vengono restituiti ordinati alfabeticamente in base all’autore.

Nell’elaborato, oltre alla fase realizzativa, viene anche descritto e messo in evidenza il corposo e approfondito lavoro di ricerca preliminare che la creazione dell’applicazione ha richiesto, un impegno senza il quale non sarebbe stato possibile individuare le risorse più adatte per la base di dati necessaria.

Una volta realizzata l’API, si è deciso di proseguire il lavoro intrapreso implementando una pratica e valida interfaccia (Latin Lemmas in Context), che permette di fruire dell’applicazione, in modo da consultare e studiare i risultati ottenibili in un formato user-friendly.

This thesis describes the personal contribution to the project aimed at the software development of VDL (Vocabolario Dantesco Latino). The project is currently underway and it aims to build the first lexicographic tool dedicated to Dante's Latin language, freely accessible on the web through the Portal dedicated to the project.

The VDL is expected to contain a selection of occurrences, that is, attestations of the Latin lemmas used by Dante in the Latin works of other authors, classic and medieval. To do so, the editors have requested a tool for the extraction of "linguistic occurrences". In this way, it will be possible to study if and how the previous Latin authors influenced Dante's Latin, and if and how Dante may have influenced later Latin authors.

To satisfy the request, an API (VDL-Corpus Corporum) has been designed and developed. The API simultaneously interrogates all the corpora present in Corpus Corporum, the web-site chosen as the reference database, in search of the occurrences of the lemma, in the texts Dante with other Latin texts, accepting the Latin lemma sought as input, supporting the search for all lemmatized forms, and providing, as a result, a list of occurrences, which are returned sorted alphabetically according to the author.

In addition to the construction phase, this paper also describes and highlights the substantial and in-depth preliminary research work required for the creation of the application, a commitment without which it would not have been possible to identify the most suitable resources for the data needed.

Once the API was completed, it was decided to continue the work by implementing a practical and valid interface (Latin Lemmas in Context), which allows you to use the application, in order to consult and study the results obtainable in a user-friendly format.

File

Nome file	Dimensione
Tesi non consultabile. Contatta l’autore

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-03262020-232844