Tipo di tesi
Tesi di laurea magistrale
Titolo
Design di un sistema Big Data per l'analisi e la gestione dei dati real-time provenienti dagli impianti di produzione delle energie rinnovabili.
Corso di studi
INFORMATICA PER L'ECONOMIA E PER L'AZIENDA (BUSINESS INFORMATICS)
Data inizio appello
02/12/2016
Riassunto (Italiano)
L'elaborato, sviluppato presso l’azienda Data Reply, tratta l'implementazione e l'analisi delle performance di un sistema Big Data applicato ad un progetto nel contesto delle Energy Renewable; l'obiettivo è quello di creare un sistema che possa gestire in real-time i dati provenienti dai sensori dei device degli impianti di produzione.
Il progetto è stato realizzato utilizzando, in parallelo, due differenti database NoSQL: Apache Cassandra e MongoDB. Ciò ha permesso di valutare quale dei due fosse più adatto alle specifiche del sistema e di analizzarne meglio le performance. Pertanto, le analisi effettuate si concentrano sulle prestazioni dei due database, in termini di operazioni di scrittura e lettura per le varie tipologie di flussi implementate: batch e real-time. Infine, sono state eseguite ulteriori analisi per comprendere meglio la differenza di prestazioni ottenuta tra i flussi batch e real-time.