ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-01312006-105127


Tipo di tesi
Tesi di laurea specialistica
Autore
Bolognesi, Davide
URN
etd-01312006-105127
Titolo
Progettazione e sviluppo di un algoritmo di clustering basato sulla densita' in uno spazio relazionale ad alta dimensionalita' e confronto con algoritmi simili presenti in letteratura
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Prof. Marcelloni, Francesco
relatore Dott. Cimino, Mario Giovanni Cosimo Antonio
relatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • Clustering Relazionale
  • Categorizzazione
  • Clustering
Data inizio appello
02/03/2006
Consultabilità
Completa
Riassunto
Le tecniche di clustering permettono di classificare degli oggetti in base a delle misurazioni delle loro caratteristiche. Un modo di rappresentare queste caratteristiche consiste nell'introdurre una misura di dissimilarità tra gli oggetti ottenendo in tal modo una matrice quadrata. All'aumentare delle dimensioni della matrice algoritmi classici come l'FCM presentano un calo di prestazioni che li rende inutilizzabili; inoltre tali algoritmi presentano difficoltà nella messa a punto dei parametri in ingresso. Gli algoritmi basati sulla densità consentono di aggirare efficacemente il problema delle alte dimensioni e della non convergenza di altri algoritmi classici. ROPTICS è un algoritmo basato sulla densità sviluppato a partire dall'algoritmo OPTICS funzionante nello spazio oggetto, cioè nella situazione in cui un oggetto è rappresentato in uno spazio multidimensionale tramite le sue coordinate. In base alla nozione di neighbor ROPTICS ricerca le zone in cui i punti sono più densi e realizza un grafico che rappresenta la struttura dei dati. In tal modo si dimostra che, pur non essendo migliore, ROPTICS costituisce una valida alternativa alle tecniche classiche di clustering.
File