logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-02112026-125323


Tipo di tesi
Tesi di laurea magistrale
Autore
MICCOLI, MARTIN
Indirizzo email
m.miccoli@studenti.unipi.it,martinmiccc@gmail.com
URN
etd-02112026-125323
Titolo
Context-Aware Retrieval for Domain-Specific RAG: A Modular Approach to Entrepreneurial AI Assistance
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof. Chiarello, Filippo
relatore Prof. Fantoni, Gualtiero
correlatore Ing. Del Debbio, Pietro
Parole chiave
  • context-aware retrieval
  • enterprise knowledge base
  • entrepreneurial decision support
  • generative ai
  • intelligent routing
  • llm
  • modular architecture
  • query transformation
  • rag
  • ragas evaluation
  • token reflection
Data inizio appello
27/02/2026
Consultabilità
Non consultabile
Data di rilascio
27/02/2096
Riassunto (Inglese)
Riassunto (Italiano)
Questa tesi magistrale in Data Science and Business Informatics presenta Token Reflection, un'architettura modulare avanzata per sistemi Retrieval-Augmented Generation (RAG) progettata per superare i limiti strutturali dei modelli tradizionali, definiti Naïve RAG. Il lavoro affronta criticamente il fenomeno del Context Loss, causato dalla staticità dei sistemi classici che ignorano la complessità cognitiva necessaria per trasformare i dati grezzi in conoscenza utile. L'architettura proposta si basa su tre pilastri innovativi: un modulo di Intelligent Query Transformation che agisce come Semantic Router per riscrivere, decomporre de-amgiguizare le query, una Memoria Episodica Dinamica per integrare lo storico delle interazioni validate e un sistema di Dynamic Prompting che adatta tono e tecnicità della risposta al profilo dell'utente. La validazione empirica ha dimostrato l'efficacia del sistema, che ha raggiunto un incremento del 147% nella metrica di Relevance rispetto alla baseline TF-IDF e un'accuratezza del 98,33% su un case study reale nel dominio del riconoscimento dei titoli accademici. Il progetto culmina nello sviluppo di un Minimum Viable Product tramite una WebApp Streamlit che implementa strategie per rendere trasparente il processo decisionale del modello.


This Master's thesis in Data Science and Business Informatics presents Token Reflection, an advanced modular architecture for Retrieval-Augmented Generation (RAG) systems designed to overcome the structural limitations of traditional models, known as Naïve RAG. The work critically addresses the phenomenon of Context Loss, caused by the static nature of classical systems that ignore the cognitive complexity required to transform raw data into useful knowledge. The proposed architecture is based on three innovative pillars: An Intelligent Query Transformation module that acts as a Semantic Router to rewrite, decompose, and disambiguate queries. A Dynamic Episodic Memory to integrate the history of validated interactions. A Dynamic Prompting system that adapts the tone and technicality of the response to the user's profile. Empirical validation demonstrated the system's effectiveness, achieving a 147% increase in the Relevance metric compared to the TF-IDF baseline and an accuracy of 98.33% on a real-world case study in the domain of academic title recognition. The project culminates in the development of a Minimum Viable Product (MVP) via a Streamlit WebApp, which implements strategies that reveals the decision-making process transparent.
File