logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-02072023-102514


Tipo di tesi
Tesi di laurea magistrale
Autore
PAPPOLLA, ROBERTA
URN
etd-02072023-102514
Titolo
Progettazione e realizzazione di un Data Lake per il supporto alla costruzione impiantistica
Dipartimento
INFORMATICA
Corso di studi
DATA SCIENCE AND BUSINESS INFORMATICS
Relatori
relatore Pellungrini, Roberto
relatore Monreale, Anna
Parole chiave
  • #pyspark
  • #DataFactory
  • #Databricks
  • #regression
  • #datahub
  • #datalake
Data inizio appello
24/02/2023
Consultabilità
Non consultabile
Data di rilascio
24/02/2093
Riassunto
All'interno di questo elaborato si discute della realizzazione di un Data Lake per il supporto alle attività di progettazione e realizzazione di impianti nel settore energetico. Poiché i dati che l’azienda archivia vengono generalmente inseriti a partire da molteplici sorgenti, su di essi è stato effettuato un processo di ETL in modo tale da elaborarli, uniformarli e convogliarli all’interno del DataLake come unica fonte dati, in modo tale da essere utilizzati per lo sviluppo di report. Parte di questi dati vengono successivamente utilizzati per effettuare la previsione di alcune caratteristiche dei componenti acquistati per la realizzazione degli impianti.
File