ETD system

Electronic theses and dissertations repository

 

Tesi etd-10242016-131822


Thesis type
Tesi di laurea magistrale
Author
CONOCI, FEDERICO
URN
etd-10242016-131822
Title
Analisi delle performance di Spark tramite tecniche di Datawarehouse
Struttura
INFORMATICA
Corso di studi
INFORMATICA PER L'ECONOMIA E PER L'AZIENDA (BUSINESS INFORMATICS)
Commissione
relatore Cisternino, Antonio
Parole chiave
  • Spark
  • Performance
  • Tuning
  • RDD
  • Data Warehouse
Data inizio appello
02/12/2016;
Consultabilità
completa
Riassunto analitico
L’oggetto di questa tesi è Spark e in particolare lo studio delle sue pre-<br>stazioni tramite tecniche di analisi di Data Warehousing. In<br>particolare, viene proposta una metodologia per analizzare in maniera siste-<br>matica l’esecuzione di una o più applicazioni su Spark indipendentemente<br>dal dominio applicativo. Sono stati inoltre effettuati dei test strutturati e<br>pensati per poter comprendere gli aspetti critici da considerare quando si<br>riscontrano problemi di inefficienza; i fattori considerati sono l’utilizzo della<br>CPU e della memoria e, più in generale, la quantità di risorse da allocare per<br>una esecuzione più efficiente delle applicazioni. Grazie a questa tecnica si ha<br>la possibilità di esplorare le metriche relative allo svolgimento dei programmi<br>mettendo l’utente nelle condizioni di individuare facilmente eventuali colli di<br>bottiglia. Infine, tramite i vari test, sono state formulate delle best practices<br>il cui scopo è quello di guidare nell’allocazione ottimale delle risorse.
File