logo SBA

ETD

Digital archive of theses discussed at the University of Pisa

 

Thesis etd-11272003-220300


Thesis type
Tesi di laurea vecchio ordinamento
Author
Stella, Marco
email address
mr.stella@libero.it
URN
etd-11272003-220300
Thesis title
Progetto e realizzazione di algoritmi di clustering per il trattamento di grosse moli di dati multi-dimensionali
Department
INGEGNERIA
Course of study
INGEGNERIA INFORMATICA
Supervisors
relatore Prof.ssa Lazzerini, Beatrice
Keywords
  • clustering
  • data mining
  • data sparsity
  • dimensionality curse
  • high dimensions
  • matrici sparse
Graduation session start date
18/12/2003
Availability
Full
Summary
I dati multi-dimensionali hanno sempre rappresentato una sfida per le tecniche di clustering. Le dimensioni dei database, l’elevata dimensionalità dei dati e la loro dispersione intrinseca sono gli aspetti che rendono più difficile l’applicazione degli algoritmi, abbattendone le prestazioni in termini di tempo e/o di accuratezza. Gli sforzi dei ricercatori per affrontare questi problemi hanno recentemente portato all’evoluzione delle tecniche e all’introduzione di proposte innovative. Con questa tesi di laurea sono state realizzate applicazioni software che implementano due diversi algoritmi orientati al clustering di grosse moli di dati multi-dimensionali. I programmi sono stati testati sia su dati artificiali che su dati reali. In uno dei casi inoltre è stata realizzata una variante dell’algoritmo implementato che lo rende efficace anche in presenza di matrici dei dati sparse.
File