Tesi etd-02052026-103435 |
Link copiato negli appunti
Tipo di tesi
Tesi di laurea magistrale
Autore
RIBELLINO, ANDREA
URN
etd-02052026-103435
Titolo
Processi ETL in ambienti distribuiti e con la gestione di grandi volumi di dati ad alta frequenza.
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Prof.ssa Scutellà, Maria Grazia
controrelatore Prof. Mencagli, Gabriele
tutor Morsiani, Fabio
controrelatore Prof. Mencagli, Gabriele
tutor Morsiani, Fabio
Parole chiave
- business intelligence
- cubi multidimensionali
- data mart
- data warehouse
- design concettuale
- design logico
- dimensioni conformi
- elt
- etl
- fatti
Data inizio appello
27/02/2026
Consultabilità
Non consultabile
Data di rilascio
27/02/2029
Riassunto (Inglese)
The thesis project was carried out during an internship at Deloitte, a consulting firm commissioned to design and implement a cloud-based data architecture, integrating ETL processes in distributed environments and managing large volumes of high-frequency data. The approach aims to replace the previous data storage system, which was on-premises, decentralised and runtime. The system implemented for the client company is used for sales analysis. It is important to consider two fundamental concepts for this type of analysis: variance analysis and breakdown into volume, price and exchange rate effects. The peculiarity of the system lies in the fact that it does not operate using tables and SQL queries, except for extraction and loading to external sources, but exclusively through files, allowing for increased efficiency and parallelism management through Checksum logic.
Riassunto (Italiano)
Il progetto di tesi è stato svolto durante un tirocinio in Deloitte, un’azienda di consulenza alla quale è stato commissionato il lavoro di progettazione e implementazione di un'architettura dati basata su cloud, integrando processi ETL in ambienti distribuiti e con la gestione di grandi volumi di dati ad alta frequenza. L’approccio mira a sostituire il precedente sistema di archiviazione dati, che era on-premises, decentralizzato e runtime. Il sistema implementato per l’azienda cliente è utilizzato per l'analisi delle vendite È importante considerare due concetti fondamentali per questo tipo di analisi: l'analisi delle varianze e la scomposizione in effetto volume, prezzo e tasso di cambio. La peculiarità del sistema risiede nel fatto che non opera tramite tabelle e query SQL, eccetto per l'estrazione e il caricamento su fonti esterne, ma esclusivamente tramite file, permettendo di aumentare l'efficienza e gestire il parallelismo tramite le logiche di Checksum.
File
| Nome file | Dimensione |
|---|---|
La tesi non è consultabile. |
|