ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-09232009-131747


Tipo di tesi
Tesi di laurea specialistica
Autore
DIOLAIUTI, SIMONE
URN
etd-09232009-131747
Titolo
Selezione efficiente degli ingressi basata su algoritmi multiobiettivo in problemi di classificazione
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
relatore Prof. Lazzerini, Beatrice
relatore Prof. Marcelloni, Francesco
relatore Ing. Cococcioni, Marco
Parole chiave
  • classificazione
  • feature selection
  • prtools
Data inizio appello
08/10/2009
Consultabilità
Non consultabile
Data di rilascio
08/10/2049
Riassunto
Nella versione corrente il PRTools presenta una grossa limitazione:
non implementa algoritmi di selezione delle features
basati su algoritmi evolutivi (né a singolo obiettivo né tantomeno
multiobiettivo). Seconda limitazione: la filosofia implementativa
di fondo degli algoritmi di classificazione non tiene conto del
loro eventuale impiego all’interno di algoritmi di selezione delle
caratteristiche e pertanto sono non ottimizzati per lavorare in tale
ambito. Detto in altre parole: quando un algoritmo di selezione
di features (specialmente se esso è evolutivo) prova una certa combinazione
di features, il classificatore impiegato per validarne
la bontà viene addestrato ogni volta ex-novo, senza sfruttare
eventuali calcoli già fatti precedentemente, relativamente a quel
sottoinsieme di features già considerato in precedenti valutazioni.
Questo rende tale toolbox poco utilizzabile nel caso di dataset
con molte features (» 10).
C’è una seconda limitazione: quando la validazione viene fatta
in n-fold cross validation, i classificatori non riusano le informazioni
calcolate relativamente ai precedenti fold. Questo introduce in
tali implementazioni, un ulteriore inefficienza.
Per questo motivo è stata proposta una intera nuova interfaccia
per routine di selezione delle features, e una nuova interfaccia
per l’implementazione di classificatori efficienti. Successivamente
è stata implementata ofeatselg, una routine di selezione delle features
basata su algoritmi evolutivi multiobiettivo, orientata alla
validazione in n-fold cross validation ed il classificatore oknnc,
che è un classificatore a minima distanza (k-nearest neighborood),
ottimizzato nell’ottica d’uso all’interno di un algoritmo di selezione
delle features e in special modo in caso di n-fold cross
validation.
Gli algoritmi implementati (ofeatselg e oknnc), sono stati testati
congiuntamente su di alcuni problemi ingegneristici con ottimi
risultati, mostrando una efficienza incomparabile con quella degli
algoritmi standard di PRTools. Sfruttando le interfaccie definite
per gli algoritmi di selezione delle features ottimizzati (interfaccia
ofeatselx, con x iniziale dell’algoritmo) e l’interfaccia per i classificatori
ottimizzati da usare in concomitanza (interfaccia oxc, con x
nome dell’algoritmo), potranno essere ricreate tutte le funzionalità
di PRTools, ma in una versione notevolmente ottimizzata ed
efficiente.
File