ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-11132012-123537


Tipo di tesi
Tesi di laurea specialistica
Autore
CORDA, DANIELE
URN
etd-11132012-123537
Titolo
Il problema del clustering di dati in presenza di una parte dei centroidi fornita dall'utente: un approccio fuzzy
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA PER LA GESTIONE D'AZIENDA
Relatori
relatore Cococcioni, Marco
relatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • data mining
  • fuzzy c-means
  • centroidi vincolati
  • clustering
Data inizio appello
13/12/2012
Consultabilità
Non consultabile
Data di rilascio
13/12/2052
Riassunto
In questo lavoro di tesi di laurea specialistica viene affrontato il problema del calcolo degli C centroidi di un insieme di punti in uno spazio N-dimensionale (operazione nota con il nome di clustering), in una situazione particolare: quella in cui una parte dei centroidi e' nota a priori (ed e' fornita dall'utente).
Per risolvere questo particolare problema di clustering sono stati proposti diversi algoritmi, che sono poi stati confrontati fra di loro. Di uno di questi, che si basa sul noto algoritmo Fuzzy C-Means (FCM) e che e' stato denominato Partially Specified Centroids Fuzzy C-Means (PSC_FCM), e' fornita anche una serie di ottimizzazioni che ne rendono l'esecuzione molto piu' veloce rispetto all'algoritmo FCM standard.
Per finire vengono forniti esempi di campi applicativi in cui l'algoritmo PSC_FCM puo' essere impiegato con successo e nei quali si ottengono centroidi migliori rispetto all'FCM sia in termini di qualità che del tempo di calcolo richiesto.
File