logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-11172011-202213


Tipo di tesi
Tesi di laurea specialistica
Autore
GIGLIO, BRUNO
URN
etd-11172011-202213
Titolo
Valutazione di diversi approcci alla selezione delle istanze per la classificazione mediante gli algoritmi C4.5 e FARC-HD
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Prof. Marcelloni, Francesco
correlatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • instance selection classification interpretability
Data inizio appello
19/12/2011
Consultabilità
Non consultabile
Data di rilascio
19/12/2051
Riassunto
Uno dei campi di studio più importanti all'interno del "data mining" riguarda lo sforzo per ottenere modelli di decisione con una elevata precisione ed una forte interpretabilità da parte di esperti umani.
Spesso modelli di decisione altamente precisi, vengono ottenuti attraverso strutture di decisione complesse e poco interpretabili.
Gli algoritmi di riduzione dei dati rappresentano un approccio già più volte utilizzato in letteratura per ottenere un tradeoff soddisfacente dal punto di vista del compromesso "Interpetability-Precision".
In questo documento viene presentato uno studio sugli algoritmi di selezione delle istanze con scopo di classificazione. Nello studio vengono presi in considerazione 39 diversi algoritmi per la selezione delle istanze ed i risultati vengono valutati facendo uso di due classificatori appartenenti a famiglie diverse (il C4.5 ed il FARC-HD).
Lo studio vuole proporre, inoltre, alcune nuove metodologie di selezione delle istanze basate sull'algoritmo genetico CHC che fanno uso del classificatore C4.5 all'interno della funzione di valutazione dei cromosomi.
Le simulazioni sono state effettuate utilizzando il KEEL software tool.
File