logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-02122023-161614


Thesis type
Tesi di laurea magistrale
Author
MARIANI, RICCARDO
URN
etd-02122023-161614
Thesis title
Progettazione e realizzazione di un Datawarehouse per l'analisi delle risorse umane
Department
INFORMATICA
Course of study
DATA SCIENCE AND BUSINESS INFORMATICS
Supervisors
relatore Dott. Pellungrini, Roberto
relatore Prof.ssa Monreale, Anna
Keywords
  • business intelligence
  • datawarehouse
  • report
Graduation session start date
14/04/2023
Availability
Withheld
Release date
14/04/2093
Summary
Un datawarehouse è una base di dati "integrata, orientata al soggetto, variabile nel tempo e non volatile" di supporto ai processi decisionali.
Integrata: requisito fondamentale di un data warehouse è l'integrazione dei dati raccolti. Nel data warehouse confluiscono dati provenienti da più sistemi transazionali e da fonti esterne. L'obiettivo dell'integrazione può essere raggiunto percorrendo differenti strade: mediante l'utilizzo di metodi di codifica uniformi, mediante il perseguimento di una omogeneità semantica di tutte le variabili, mediante l'utilizzo delle stesse unità di misura;
Orientata al soggetto: il DW è orientato a temi aziendali specifici, alle applicazioni o alle funzioni. In un DW i dati vengono archiviati in modo da essere facilmente letti o elaborati dagli utenti. L'obiettivo, quindi, non è più quello di minimizzare la ridondanza mediante la normalizzazione, ma quello di fornire dati organizzati in modo tale da favorire la produzione di informazioni. Si passa dalla progettazione per funzioni ad una modellazione dei dati che consenta una visione multidimensionale degli stessi;
Variabile nel tempo: i dati archiviati all'interno di un DW coprono un orizzonte temporale molto più esteso rispetto a quelli archiviati in un sistema operazionale. Nel DW sono contenute una serie di informazioni relative alle aree di interesse che colgono la situazione relativa ad un determinato fenomeno in un determinato intervallo temporale piuttosto esteso. Ciò comporta che i dati contenuti in un DW siano aggiornati fino ad una certa data che, nella maggior parte dei casi, è antecedente a quella in cui l'utente interroga il sistema. Ciò differisce da quanto si verifica in un sistema transazionale, nel quale i dati corrispondono sempre ad una situazione aggiornata, solitamente incapace di fornire un quadro storico del fenomeno analizzato;
Non volatile: tale caratteristica indica la non modificabilità dei dati contenuti nel DW, che consente accessi in sola lettura. Ciò comporta una semplicità di progettazione della banca dati rispetto a quella di un'applicazione transazionale. In tale contesto non si considerano le possibili anomalie dovute agli aggiornamenti, né tanto meno si ricorre a strumenti complessi per gestire l'integrità referenziale o per bloccare record a cui possono accedere altri utenti in fase di aggiornamento.
L'azienda Websolute SPA ha richiesto la creazione di un datawarehouse per analizzare il carico di lavoro sui dipendenti, tracciando nel tempo l'avanzamento delle attività e dei progetti, se questi rispettavano la pianificazione fatta a priori. Altro punto di rilievo, è stata richiesta la possibilità di individuare quali reparti, o Project Manager, fossero in situazione di stress e chi invece avesse meno carico da lavoro, così da poter spostare le risorse (dipendenti) da un progetto ad un altro, senza ricorso di outsourcing o consulenze esterne.
Il processo di creazione del DataWarehouse ha comportato l'interazione da parte di diversi reparti, per capire l'esigenze primarie del business, ma soprattutto reperire i dati da cui estrarne informazione per i processi decisionali.
Sono stati utilizzati esclusivamente software dell'azienda Microsoft, in quanto già venivano utilizzati all'interno dell'azienda software quali SQL Server , SSMS, SSIS. Oltre questi la scelta del tool di Datavisualization è ricaduta su PowerBi (della stessa Microsoft).
File