ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-11272003-220300


Tipo di tesi
Tesi di laurea vecchio ordinamento
Autore
Stella, Marco
Indirizzo email
mr.stella@libero.it
URN
etd-11272003-220300
Titolo
Progetto e realizzazione di algoritmi di clustering per il trattamento di grosse moli di dati multi-dimensionali
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • matrici sparse
  • clustering
  • data mining
  • high dimensions
  • data sparsity
  • dimensionality curse
Data inizio appello
18/12/2003
Consultabilità
Completa
Riassunto
I dati multi-dimensionali hanno sempre rappresentato una sfida per le tecniche di clustering. Le dimensioni dei database, l’elevata dimensionalità dei dati e la loro dispersione intrinseca sono gli aspetti che rendono più difficile l’applicazione degli algoritmi, abbattendone le prestazioni in termini di tempo e/o di accuratezza. Gli sforzi dei ricercatori per affrontare questi problemi hanno recentemente portato all’evoluzione delle tecniche e all’introduzione di proposte innovative. Con questa tesi di laurea sono state realizzate applicazioni software che implementano due diversi algoritmi orientati al clustering di grosse moli di dati multi-dimensionali. I programmi sono stati testati sia su dati artificiali che su dati reali. In uno dei casi inoltre è stata realizzata una variante dell’algoritmo implementato che lo rende efficace anche in presenza di matrici dei dati sparse.
File