Tesi etd-02102026-233318 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea magistrale
Autore
BORSETTO, DIEGO
URN
etd-02102026-233318
Titolo
Progettazione e realizzazione di una Data Platform per la Business Intelligence in un’azienda di trasporto pubblico: architettura e caso di studio
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof. Frangioni, Antonio
controrelatore Prof. Bruni, Roberto
tutor Ing. Marchi, Francesca
controrelatore Prof. Bruni, Roberto
tutor Ing. Marchi, Francesca
Parole chiave
- Business Intelligence
- Data Platform
- trasporto pubblico
Data inizio appello
27/02/2026
Consultabilità
Completa
Riassunto (Inglese)
This thesis addressed the topic of managing and enhancing information within a company operating in the public transport sector, characterized by a complex operational context and a heterogeneous information ecosystem.
As highlighted in the introductory chapter, the presence of numerous data sources—differing in nature, format, and purpose—represents a significant obstacle to obtaining a unified, timely, and reliable view of economic and operational performance. The work carried out therefore fits into the concrete need to bridge the gap between data availability and their effective use in support of decision-making processes.
The main objective of the thesis, defined in Chapter 1, was the development of a Business Intelligence solution capable of addressing specific business needs through the use of professional tools adopted in real-world contexts. This objective was pursued through the design and implementation of a Data Platform based on TIBCO Data Virtualization for data source integration and management, and on Power BI for the creation of interactive reports and dashboards aimed at business users.
From an architectural perspective, the developed solution made it possible to define an end-to-end flow that, starting from existing information sources, leads to data consumption through a shared semantic layer. The stratification of the Data Platform into logical layers (L0–L3) allowed for a clear separation of data acquisition, transformation, and presentation phases, improving the maintainability of the solution and ensuring consistency and reusability of metrics over time. This approach directly addresses the need, highlighted in the introductory phase, to overcome information fragmentation and to provide a centralized and reliable data foundation.
In line with the project’s motivations, particular attention was paid to the usability of information by non-technical users. The use of Power BI as the presentation layer made it possible to make data accessible through intuitive and interactive reports, encouraging more informed and autonomous use of information and contributing to a cultural shift toward a more data-driven approach, consistent with the digital transformation path undertaken by the client company.
A significant contribution of the thesis concerns the analysis of line-level profitability, explored in depth in the case study presented in Chapter 6. In this context, it emerged that the differing granularity at which costs and revenues are recorded in company systems, combined with the absence of a stable mapping between vehicles and lines, makes a direct calculation of profitability in a strictly accounting sense impossible. This informational limitation was explicitly acknowledged and addressed through the definition of a cost allocation model based on observable operational drivers, with the aim of providing a coherent and useful analytical tool for relative comparison among lines.
Within this framework, the definition of normalized KPIs—such as revenue per kilometer, estimated cost per kilometer, margin per kilometer, and indicators of economic sustainability—made it possible to compare different operational realities and to identify critical issues and areas for improvement.
Finally, consistent with the applied and professional nature of the project, the work was validated through data quality control activities, consistency checks against original sources, reconciliations shared with the client, and robustness analyses of the model under varying assumptions. These activities contributed to strengthening the overall reliability of the solution and demonstrating its effective usefulness in the reference operational context.
Overall, the thesis demonstrates how the adoption of a Data Platform designed according to solid architectural principles and oriented toward a shared semantic layer can represent a key element in improving data governance and effectively supporting decision-making processes in a public transport company, even in the presence of structural information constraints.
As highlighted in the introductory chapter, the presence of numerous data sources—differing in nature, format, and purpose—represents a significant obstacle to obtaining a unified, timely, and reliable view of economic and operational performance. The work carried out therefore fits into the concrete need to bridge the gap between data availability and their effective use in support of decision-making processes.
The main objective of the thesis, defined in Chapter 1, was the development of a Business Intelligence solution capable of addressing specific business needs through the use of professional tools adopted in real-world contexts. This objective was pursued through the design and implementation of a Data Platform based on TIBCO Data Virtualization for data source integration and management, and on Power BI for the creation of interactive reports and dashboards aimed at business users.
From an architectural perspective, the developed solution made it possible to define an end-to-end flow that, starting from existing information sources, leads to data consumption through a shared semantic layer. The stratification of the Data Platform into logical layers (L0–L3) allowed for a clear separation of data acquisition, transformation, and presentation phases, improving the maintainability of the solution and ensuring consistency and reusability of metrics over time. This approach directly addresses the need, highlighted in the introductory phase, to overcome information fragmentation and to provide a centralized and reliable data foundation.
In line with the project’s motivations, particular attention was paid to the usability of information by non-technical users. The use of Power BI as the presentation layer made it possible to make data accessible through intuitive and interactive reports, encouraging more informed and autonomous use of information and contributing to a cultural shift toward a more data-driven approach, consistent with the digital transformation path undertaken by the client company.
A significant contribution of the thesis concerns the analysis of line-level profitability, explored in depth in the case study presented in Chapter 6. In this context, it emerged that the differing granularity at which costs and revenues are recorded in company systems, combined with the absence of a stable mapping between vehicles and lines, makes a direct calculation of profitability in a strictly accounting sense impossible. This informational limitation was explicitly acknowledged and addressed through the definition of a cost allocation model based on observable operational drivers, with the aim of providing a coherent and useful analytical tool for relative comparison among lines.
Within this framework, the definition of normalized KPIs—such as revenue per kilometer, estimated cost per kilometer, margin per kilometer, and indicators of economic sustainability—made it possible to compare different operational realities and to identify critical issues and areas for improvement.
Finally, consistent with the applied and professional nature of the project, the work was validated through data quality control activities, consistency checks against original sources, reconciliations shared with the client, and robustness analyses of the model under varying assumptions. These activities contributed to strengthening the overall reliability of the solution and demonstrating its effective usefulness in the reference operational context.
Overall, the thesis demonstrates how the adoption of a Data Platform designed according to solid architectural principles and oriented toward a shared semantic layer can represent a key element in improving data governance and effectively supporting decision-making processes in a public transport company, even in the presence of structural information constraints.
Riassunto (Italiano)
La presente tesi ha affrontato il tema della gestione e valorizzazione delle informazioni all’interno di un’azienda operante nel settore del trasporto pubblico, caratterizzata da un contesto operativo complesso e da un ecosistema informativo eterogeneo.
Come evidenziato nel capitolo introduttivo, la presenza di numerose sorgenti dati, differenti per natura, formato e finalità, rappresenta un ostacolo significativo all’ottenimento di una visione unitaria, tempestiva e affidabile delle performance economiche e operative. Il lavoro svolto si inserisce pertanto nell’esigenza concreta di colmare il divario tra la disponibilità dei dati e il loro effettivo utilizzo a supporto dei processi decisionali.
L’obiettivo principale della tesi, definito nel Capitolo 1, era lo sviluppo di una soluzione di Business Intelligence in grado di rispondere a specifiche esigenze aziendali, facendo uso di strumenti professionali adottati in contesti reali. Tale obiettivo è stato perseguito attraverso la progettazione e l’implementazione di una Data Platform basata su TIBCO Data Virtualization per l’integrazione e la gestione delle fonti dati e su Power BI per la realizzazione di report e dashboard interattive orientate agli utenti di business.
Dal punto di vista architetturale, la soluzione sviluppata ha consentito di definire un flusso end-to-end che, partendo dalle sorgenti informative esistenti, conduce alla fruizione dei dati attraverso un livello semantico condiviso. La stratificazione della Data Platform in livelli logici (L0–L3) ha permesso di separare in modo chiaro le fasi di acquisizione, trasformazione e presentazione del dato, migliorando la manutenibilità della soluzione e garantendo coerenza e riutilizzabilità delle metriche nel tempo. Questo approccio risponde direttamente alla necessità, evidenziata in fase introduttiva, di superare la frammentazione informativa e di fornire una base dati centralizzata e affidabile.
In linea con le motivazioni del progetto, particolare attenzione è stata posta alla fruibilità delle informazioni da parte di utenti non tecnici. L’utilizzo di Power BI come livello di presentazione ha permesso di rendere accessibili i dati attraverso report intuitivi e interattivi, favorendo un utilizzo più consapevole e autonomo delle informazioni e contribuendo a un cambiamento culturale verso un approccio maggiormente data-driven, coerente con il percorso di trasformazione digitale intrapreso dall’azienda cliente.
Un contributo rilevante della tesi riguarda l’analisi del tema della marginalità per linea, approfondita nel case study presentato nel Capitolo 6. In tale contesto è emerso come la diversa granularità con cui costi e ricavi sono rilevati nei sistemi aziendali, unita all’assenza di un mapping stabile tra veicolo e linea, renda impossibile un calcolo diretto della marginalità in senso strettamente contabile. Questo limite informativo è stato esplicitamente riconosciuto e affrontato attraverso la definizione di un modello di allocazione dei costi basato su driver operativi osservabili, con l’obiettivo di fornire uno strumento di analisi coerente e utile al confronto relativo tra le linee.
In questo contesto, la definizione di KPI normalizzati quali ricavi per chilometro, costi stimati per chilometro, margine per chilometro e indicatori di sostenibilità economica ha permesso di rendere confrontabili realtà operative differenti e di individuare criticità ed aree di miglioramento.
Infine, coerentemente con la natura applicativa e professionale del progetto, il lavoro è stato validato attraverso attività di controllo della qualità del dato, verifiche di coerenza con le fonti originali, quadrature condivise con il cliente e analisi di robustezza del modello al variare delle ipotesi. Tali attività hanno contribuito a rafforzare l’affidabilità complessiva della soluzione e a dimostrarne l’effettiva utilità nel contesto operativo di riferimento.
Nel complesso, la tesi dimostra come l’adozione di una Data Platform progettata secondo criteri architetturali solidi e orientata a un livello semantico condiviso possa rappresentare un elemento chiave per migliorare la governance dei dati e supportare in modo efficace i processi decisionali in un’azienda di trasporto pubblico, anche in presenza di vincoli informativi strutturali.
Come evidenziato nel capitolo introduttivo, la presenza di numerose sorgenti dati, differenti per natura, formato e finalità, rappresenta un ostacolo significativo all’ottenimento di una visione unitaria, tempestiva e affidabile delle performance economiche e operative. Il lavoro svolto si inserisce pertanto nell’esigenza concreta di colmare il divario tra la disponibilità dei dati e il loro effettivo utilizzo a supporto dei processi decisionali.
L’obiettivo principale della tesi, definito nel Capitolo 1, era lo sviluppo di una soluzione di Business Intelligence in grado di rispondere a specifiche esigenze aziendali, facendo uso di strumenti professionali adottati in contesti reali. Tale obiettivo è stato perseguito attraverso la progettazione e l’implementazione di una Data Platform basata su TIBCO Data Virtualization per l’integrazione e la gestione delle fonti dati e su Power BI per la realizzazione di report e dashboard interattive orientate agli utenti di business.
Dal punto di vista architetturale, la soluzione sviluppata ha consentito di definire un flusso end-to-end che, partendo dalle sorgenti informative esistenti, conduce alla fruizione dei dati attraverso un livello semantico condiviso. La stratificazione della Data Platform in livelli logici (L0–L3) ha permesso di separare in modo chiaro le fasi di acquisizione, trasformazione e presentazione del dato, migliorando la manutenibilità della soluzione e garantendo coerenza e riutilizzabilità delle metriche nel tempo. Questo approccio risponde direttamente alla necessità, evidenziata in fase introduttiva, di superare la frammentazione informativa e di fornire una base dati centralizzata e affidabile.
In linea con le motivazioni del progetto, particolare attenzione è stata posta alla fruibilità delle informazioni da parte di utenti non tecnici. L’utilizzo di Power BI come livello di presentazione ha permesso di rendere accessibili i dati attraverso report intuitivi e interattivi, favorendo un utilizzo più consapevole e autonomo delle informazioni e contribuendo a un cambiamento culturale verso un approccio maggiormente data-driven, coerente con il percorso di trasformazione digitale intrapreso dall’azienda cliente.
Un contributo rilevante della tesi riguarda l’analisi del tema della marginalità per linea, approfondita nel case study presentato nel Capitolo 6. In tale contesto è emerso come la diversa granularità con cui costi e ricavi sono rilevati nei sistemi aziendali, unita all’assenza di un mapping stabile tra veicolo e linea, renda impossibile un calcolo diretto della marginalità in senso strettamente contabile. Questo limite informativo è stato esplicitamente riconosciuto e affrontato attraverso la definizione di un modello di allocazione dei costi basato su driver operativi osservabili, con l’obiettivo di fornire uno strumento di analisi coerente e utile al confronto relativo tra le linee.
In questo contesto, la definizione di KPI normalizzati quali ricavi per chilometro, costi stimati per chilometro, margine per chilometro e indicatori di sostenibilità economica ha permesso di rendere confrontabili realtà operative differenti e di individuare criticità ed aree di miglioramento.
Infine, coerentemente con la natura applicativa e professionale del progetto, il lavoro è stato validato attraverso attività di controllo della qualità del dato, verifiche di coerenza con le fonti originali, quadrature condivise con il cliente e analisi di robustezza del modello al variare delle ipotesi. Tali attività hanno contribuito a rafforzare l’affidabilità complessiva della soluzione e a dimostrarne l’effettiva utilità nel contesto operativo di riferimento.
Nel complesso, la tesi dimostra come l’adozione di una Data Platform progettata secondo criteri architetturali solidi e orientata a un livello semantico condiviso possa rappresentare un elemento chiave per migliorare la governance dei dati e supportare in modo efficace i processi decisionali in un’azienda di trasporto pubblico, anche in presenza di vincoli informativi strutturali.
File
| Nome file | Dimensione |
|---|---|
| TESI_Borsetto.pdf | 9.47 Mb |
Contatta l’autore |
|