ETD system

Electronic theses and dissertations repository

 

Tesi etd-11272003-220300


Thesis type
Tesi di laurea vecchio ordinamento
Author
Stella, Marco
email address
mr.stella@libero.it
URN
etd-11272003-220300
Title
Progetto e realizzazione di algoritmi di clustering per il trattamento di grosse moli di dati multi-dimensionali
Struttura
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Commissione
relatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • matrici sparse
  • clustering
  • data mining
  • high dimensions
  • data sparsity
  • dimensionality curse
Data inizio appello
18/12/2003;
Consultabilità
completa
Riassunto analitico
I dati multi-dimensionali hanno sempre rappresentato una sfida per le tecniche di clustering. Le dimensioni dei database, l’elevata dimensionalità dei dati e la loro dispersione intrinseca sono gli aspetti che rendono più difficile l’applicazione degli algoritmi, abbattendone le prestazioni in termini di tempo e/o di accuratezza. Gli sforzi dei ricercatori per affrontare questi problemi hanno recentemente portato all’evoluzione delle tecniche e all’introduzione di proposte innovative. Con questa tesi di laurea sono state realizzate applicazioni software che implementano due diversi algoritmi orientati al clustering di grosse moli di dati multi-dimensionali. I programmi sono stati testati sia su dati artificiali che su dati reali. In uno dei casi inoltre è stata realizzata una variante dell’algoritmo implementato che lo rende efficace anche in presenza di matrici dei dati sparse.
File