ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-06272007-181809


Tipo di tesi
Tesi di laurea specialistica
Autore
De Pascale, Emanuele
URN
etd-06272007-181809
Titolo
Ottimizzazione di interrogazioni con groupby
Dipartimento
SCIENZE MATEMATICHE, FISICHE E NATURALI
Corso di studi
INFORMATICA
Relatori
Relatore Albano, Antonio
Parole chiave
  • groupby
  • ottimizzazione
  • group by
Data inizio appello
20/07/2007
Consultabilità
Completa
Riassunto
Il lavoro di tesi è stato volto con l’intento di analizzare alcune proprietà delle
interrogazioni SQL che contengono l’operatore di giunzione e quello di raggruppamento.
Gli operatori di giunzione e di raggruppamento sono di cruciale importanza
nell’utilizzo di un data warehouse in quanto permettono di aggregare i
dati secondo criteri prescelti al fine di produrre analisi di questi con uso di funzioni
statistiche. Il lavoro è articolato in tre sezioni. Nella prima si prende in
esame una serie di proprietà dell’operatore di raggruppamento e di altri operatori
dell’algebra relazionale. Nella seconda invece saranno analizzate proprietà
associate ad espressioni algebriche contenenti l’operatore di giunzione e quello di
raggruppamento. Infine, nella terza ed ultima parte, si vedrà una generalizzazione
multidimensionale dei risultati ottenuti in precedenza per il caso bidimensionale.
Alla problematica dell’ottimizzazione di interrogazioni SQL contententi l’operatore
di ragguppamento e quello di giunzione, è stata dedicata, negli ultimi anni,
particolare attenzione in quanto alla base di analisi multidimensionali e di applicazioni
OLAP (On Line Analytical Processing). Tutto ciò è stato sicuramente
favorito dall’avanzamento tecnologico che ha consentito di immagazzinare volumi
di dati sempre maggiori, dando così la possibilità a varie organizzazioni, di
vari settori, di effettuare analisi più approfondite delle proprie attività.
Nel capitolo 1 si chiarisce il contesto in cui nasce l’esigenza di analisi multidimensionali
e la visione di eventi della realtà come punti di uno spazio n-dimensionale;
nel secondo invece si richiamano alcune proprietà dell’algebra relazionale,
dei concetti di ottimizzazione di interrogazioni SQL e si definiscono le
ipotesi di lavoro valide per il resto del lavoro; molto importante in tale capitolo
è la sezione dedicata alle regole di equivalenza fra operatori relazionali. Passando
ai successivi capitoli (3-4-5) si vedranno le proprietà associate ad alberi logici
(o espressioni relazionali) contententi l’operatore di giunzione e quello di raggruppamento.
Lo stile con cui sono stati redatti questi capitoli è sempre uguale e
prevede, tramite un esempio, un’introduzione al problema, la formalizzazione di
questo, un’analisi della letteratura ed un enunciato formale che lo risolva. Infine,
il sesto ed ultimo capitolo contiene una generalizzazione al caso n-dimensionale
delle regole precedentemente individuate per il caso bidimensionale ed una alla
possibile presenza di clausole HAVING nelle interrogazioni oggetto di studio.
File