ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-11172014-095538


Tipo di tesi
Tesi di laurea magistrale
Autore
MARULLI, FEDERICA
URN
etd-11172014-095538
Titolo
Right-time BI: piattaforma per analisi Multi-Topic di dati prodotti da dispositivi cloud-ready
Dipartimento
INFORMATICA
Corso di studi
INFORMATICA PER L'ECONOMIA E PER L'AZIENDA (BUSINESS INFORMATICS)
Relatori
relatore Pedreschi, Dino
Parole chiave
  • tecnologia nosql
  • data warehousing
  • internet of things
  • business intelligence
Data inizio appello
05/12/2014
Consultabilità
Completa
Riassunto
Al giorno d'oggi, milioni di persone in tutto il mondo utilizzano Internet per navigare sul Web, inviare e ricevere messaggi di posta elettronica, accedere a contenuti e servizi multimediali, utilizzare applicazioni di social networking e molte altre attività. Mentre sempre più persone avranno accesso a tale infrastruttura dell'informazione e della comunicazione globale, si delinea in maniera sempre più netta l'uso di Internet come una piattaforma globale per lasciare comunicare e dialogare macchine e oggetti intelligenti.
Sensori, attuatori e qualsiasi dispositivo in grado di catturare informazioni sarà sempre più invisibilmente integrato nell'ambiente che ci circonda per rispondere a questa nuova sfida, l'Internet-of-Things.
Si apre così la strada a nuove applicazioni, nuove modalità di interazione, nuovi modi di lavorare, nuovi modi di vivere.
Questo fenomeno comporta la generazione di enormi quantità di dati che necessitano di essere memorizzati e reperiti velocemente: il cloud computing rappresenta in questo senso una tecnologia matura che può fornire una valida infrastruttura virtuale per tale architettura, in termini di immagazzinamento e potenza di calcolo.
La fusione di queste due tecnologie complementari apre diversi scenari connessi all'analisi dei big data. Alcune delle aree in cui trova potenzialmente un'ampia applicabilità sono il monitoraggio ambientale, la mobilità, l'assistenza sanitaria, la gestione del prodotto e del magazzino, la sicurezza e la sorveglianza.
Una delle questioni principali connesse al paradigma dell'IoT riguarda proprio la possibilità di generare servizi a partire dalle funzionalità e risorse messe a disposizione dagli oggetti intelligenti, che il più delle volte sono rappresentate da flussi di dati che possono essere pensati come commodities tradizionali, come materie prime.
Affinchè i dati possano essere trasformati in conoscenza, e quindi generare dei servizi a valore aggiunto è necessario definire un metodo che consenta di fornire una rappresentazione standardizzata degli smart object, livellando l'etereogeneità dei dispositivi e delle risorse, e soprattutto implementare un'architettura che consenta l'integrazione e l'elaborazione di tali risorse affinchè siano presentate in una forma efficiente e facilmente interpretabile.
Ma ciò non è sufficiente. Bisogna rendere fruibile questa conoscenza all'interno di una finestra temporale che consenta agli utenti finali di strutturare dei processi decisionali a livello strategico ed operativo: il right-time rappresenta pertanto un fattore critico nella gestione dei big data in grado di concorrere alla generazione di nuove opportunità.

In questa tesi viene presentata una possibile soluzione orientata a colmare il gap esistente tra le rilevazioni dei dati a partire da dispositivi cloud-ready e la possibile fruizione dell'informazione in maniera efficace e tempestiva.
I dati provengono da vari sensori fissi e mobili geograficamente dispersi in grado di effettuare rilevazioni real-time che spaziano dal settore dei trasporti al monitoraggio climatico. Tale data stream viene trasmesso ad un'infrastruttura cloud, interfacciata col database Cassandra, un database management system non relazionale ottimizzato per la gestione di grandi quantità di informazioni. La piattaforma progettata per il supporto alle decisioni poggerà su un processo di elaborazione di dati in grado di astrarre le informazioni dal singolo dominio di analisi e di elaborarle dinamicamente in maniera indipendente dalla loro specifica natura.
Le tradizionali tecniche di Business Intelligence diventano quindi lo strumento per estrarre il potenziale informativo dal flusso di dati aggiornato in tempo reale che risiede sul cloud, in una logica di sincronizzazione right-time specifica per ogni dominio d'interesse. Il tool di BI Pentaho, utilizzato per implementare la soluzione, trasforma il flusso dei dati in modelli consultabili attraverso un sistema di front-end: dalla navigazione del cubo OLAP alla visualizzazione di dashboards interattivi focalizzate in particolare sull'aspetto del geo-mapping.
La piattaforma realizzata prevede la possibilità di integrare la soluzione con una ulteriore struttura multidimensionale che consenta analisi across topic per effettuare analisi congiunte dei risultati di tipo spazio-temporali.
File