ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-11222019-102852


Tipo di tesi
Tesi di laurea magistrale
Autore
D'ALBERTI, ANTONINO
URN
etd-11222019-102852
Titolo
Progettazione e realizzazione del batch layer di un'infrastruttura Big Data basata su architettura Lambda
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
COMPUTER ENGINEERING
Relatori
relatore Prof. Cimino, Mario Giovanni Cosimo Antonio
relatore Prof.ssa Vaglini, Gigliola
relatore Dott. Zitarosa, Romeo
Parole chiave
  • lambda architecture
  • infrastructure
  • big data
  • batch layer
Data inizio appello
09/12/2019
Consultabilità
Completa
Riassunto
L’obiettivo fondamentale di questa tesi è stato quello di progettare e implementare il batch layer di un’infrastruttura Big Data che segue il modello dell’architettura lambda. È stata definita una pipeline che si serve di un sistema di Storage-as-a-Service, ovvero un servizio di storage in cloud con le caratteristiche di un file system remoto. Grazie a questa scelta si ha la garanzia di poter stoccare una quantità di dati potenzialmente illimitata senza gli oneri che derivano dalla gestione di una componente di storage. Rimangono invece i vantaggi in termini di scalabilità, derivanti da un’organizzazione dello storage come file system.
File