logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-02072024-153457


Tipo di tesi
Tesi di laurea magistrale
Autore
TOTI, RICCARDO
URN
etd-02072024-153457
Titolo
Scalable and horizontal real-time infrastructure for deploying NLP tools
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof.ssa Passaro, Lucia C.
Parole chiave
  • python
  • langchain
  • haystack
  • docker
  • microservices
  • distributed
  • opensearch
  • nlp
  • llm
  • kubernetes
Data inizio appello
23/02/2024
Consultabilità
Non consultabile
Data di rilascio
23/02/2094
Riassunto
La tesi si concentra sull'implementazione di un'infrastruttura privatizzata, scalabile e orizzontale per una soluzione di Retrieval Augmented Generation completamente open-source. Analizzando le componenti e le tecniche di calcolo distribuito a microservizi per l'elaborazione del linguaggio naturale (NLP), la ricerca esplora i punti di forza e limitazioni di tale approccio. La soluzione vanta un sofisticato sistemata di monitoraggio delle sue componenti per un'approfondita analisi ed un veloce intervento in caso di problematiche.
---
This thesis focuses on the implementation of a privatized, scalable and horizontal infrastructure for a fully open-source Augmented Generation Retrieval solution. Analyzing the components and techniques of distributed microservice computing for natural language processing (NLP), the research explores the strengths and limitations of this approach. The solution boasts a sophisticated monitoring systemata of its components for in-depth analysis and quick intervention in case of issues.
File