Tesi etd-03262020-232844 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea magistrale
Autore
SPADI, ALESSIA
URN
etd-03262020-232844
Titolo
Contributo allo sviluppo software del Vocabolario Dantesco Latino (VDL): un'applicazione per l'indagine lessicografica sul latino di Dante
Dipartimento
FILOLOGIA, LETTERATURA E LINGUISTICA
Corso di studi
INFORMATICA UMANISTICA
Relatori
relatore Prof. Casarosa, Vittore
correlatore Prof. Pontari, Paolo
correlatore Prof. Pontari, Paolo
Parole chiave
- computational linguistics
- Dante Alighieri
- latin
- latino
- linguistic studies on Dante
- linguistica computazionale
- software development
- studi linguistici su Dante
- sviluppo software
- vocabolario dantesco latino
Data inizio appello
27/04/2020
Consultabilità
Tesi non consultabile
Riassunto
In questo elaborato viene descritto il contributo personale al progetto finalizzato allo sviluppo software del VDL (Vocabolario Dantesco Latino), un progetto attualmente in corso d’opera, che mira a costruire il primo strumento lessicografico dedicato alla lingua latina di Dante, liberamente accessibile sul web nel Portale dedicato al progetto.
È previsto che il VDL contenga una selezione di occorrenze, ossia attestazioni dei lemmi latini danteschi nelle opere in latino di altri autori, classici e medievali. Per questo i redattori/utilizzatori hanno richiesto uno strumento per l’estrazione di “occorrenze linguistiche”. In questo modo sarà possibile studiare se e come i precedenti autori latini hanno influenzato il latino di Dante, e se e come Dante può avere influenzato autori latini successivi.
Per soddisfare la richiesta è stata progettata e messa a punto un’API (VDL-Corpus Corporum) che interroga simultaneamente tutti i corpora presenti in Corpus Corporum, il sito scelto come base di dati di riferimento, alla ricerca delle occorrenze del lemma, nei testi danteschi con in altri testi latini, accettando in input il lemma latino cercato, supportando la ricerca di tutte le forme lemmatizzate, e fornendo come risultato un elenco di occorrenze, che vengono restituiti ordinati alfabeticamente in base all’autore.
Nell’elaborato, oltre alla fase realizzativa, viene anche descritto e messo in evidenza il corposo e approfondito lavoro di ricerca preliminare che la creazione dell’applicazione ha richiesto, un impegno senza il quale non sarebbe stato possibile individuare le risorse più adatte per la base di dati necessaria.
Una volta realizzata l’API, si è deciso di proseguire il lavoro intrapreso implementando una pratica e valida interfaccia (Latin Lemmas in Context), che permette di fruire dell’applicazione, in modo da consultare e studiare i risultati ottenibili in un formato user-friendly.
This thesis describes the personal contribution to the project aimed at the software development of VDL (Vocabolario Dantesco Latino). The project is currently underway and it aims to build the first lexicographic tool dedicated to Dante's Latin language, freely accessible on the web through the Portal dedicated to the project.
The VDL is expected to contain a selection of occurrences, that is, attestations of the Latin lemmas used by Dante in the Latin works of other authors, classic and medieval. To do so, the editors have requested a tool for the extraction of "linguistic occurrences". In this way, it will be possible to study if and how the previous Latin authors influenced Dante's Latin, and if and how Dante may have influenced later Latin authors.
To satisfy the request, an API (VDL-Corpus Corporum) has been designed and developed. The API simultaneously interrogates all the corpora present in Corpus Corporum, the web-site chosen as the reference database, in search of the occurrences of the lemma, in the texts Dante with other Latin texts, accepting the Latin lemma sought as input, supporting the search for all lemmatized forms, and providing, as a result, a list of occurrences, which are returned sorted alphabetically according to the author.
In addition to the construction phase, this paper also describes and highlights the substantial and in-depth preliminary research work required for the creation of the application, a commitment without which it would not have been possible to identify the most suitable resources for the data needed.
Once the API was completed, it was decided to continue the work by implementing a practical and valid interface (Latin Lemmas in Context), which allows you to use the application, in order to consult and study the results obtainable in a user-friendly format.
È previsto che il VDL contenga una selezione di occorrenze, ossia attestazioni dei lemmi latini danteschi nelle opere in latino di altri autori, classici e medievali. Per questo i redattori/utilizzatori hanno richiesto uno strumento per l’estrazione di “occorrenze linguistiche”. In questo modo sarà possibile studiare se e come i precedenti autori latini hanno influenzato il latino di Dante, e se e come Dante può avere influenzato autori latini successivi.
Per soddisfare la richiesta è stata progettata e messa a punto un’API (VDL-Corpus Corporum) che interroga simultaneamente tutti i corpora presenti in Corpus Corporum, il sito scelto come base di dati di riferimento, alla ricerca delle occorrenze del lemma, nei testi danteschi con in altri testi latini, accettando in input il lemma latino cercato, supportando la ricerca di tutte le forme lemmatizzate, e fornendo come risultato un elenco di occorrenze, che vengono restituiti ordinati alfabeticamente in base all’autore.
Nell’elaborato, oltre alla fase realizzativa, viene anche descritto e messo in evidenza il corposo e approfondito lavoro di ricerca preliminare che la creazione dell’applicazione ha richiesto, un impegno senza il quale non sarebbe stato possibile individuare le risorse più adatte per la base di dati necessaria.
Una volta realizzata l’API, si è deciso di proseguire il lavoro intrapreso implementando una pratica e valida interfaccia (Latin Lemmas in Context), che permette di fruire dell’applicazione, in modo da consultare e studiare i risultati ottenibili in un formato user-friendly.
This thesis describes the personal contribution to the project aimed at the software development of VDL (Vocabolario Dantesco Latino). The project is currently underway and it aims to build the first lexicographic tool dedicated to Dante's Latin language, freely accessible on the web through the Portal dedicated to the project.
The VDL is expected to contain a selection of occurrences, that is, attestations of the Latin lemmas used by Dante in the Latin works of other authors, classic and medieval. To do so, the editors have requested a tool for the extraction of "linguistic occurrences". In this way, it will be possible to study if and how the previous Latin authors influenced Dante's Latin, and if and how Dante may have influenced later Latin authors.
To satisfy the request, an API (VDL-Corpus Corporum) has been designed and developed. The API simultaneously interrogates all the corpora present in Corpus Corporum, the web-site chosen as the reference database, in search of the occurrences of the lemma, in the texts Dante with other Latin texts, accepting the Latin lemma sought as input, supporting the search for all lemmatized forms, and providing, as a result, a list of occurrences, which are returned sorted alphabetically according to the author.
In addition to the construction phase, this paper also describes and highlights the substantial and in-depth preliminary research work required for the creation of the application, a commitment without which it would not have been possible to identify the most suitable resources for the data needed.
Once the API was completed, it was decided to continue the work by implementing a practical and valid interface (Latin Lemmas in Context), which allows you to use the application, in order to consult and study the results obtainable in a user-friendly format.
File
Nome file | Dimensione |
---|---|
Tesi non consultabile. |