ETD system

Electronic theses and dissertations repository

 

Tesi etd-09232009-131747


Thesis type
Tesi di laurea specialistica
Author
DIOLAIUTI, SIMONE
URN
etd-09232009-131747
Title
Selezione efficiente degli ingressi basata su algoritmi multiobiettivo in problemi di classificazione
Struttura
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Commissione
relatore Prof. Lazzerini, Beatrice
relatore Prof. Marcelloni, Francesco
relatore Ing. Cococcioni, Marco
Parole chiave
  • classificazione
  • feature selection
  • prtools
Data inizio appello
08/10/2009;
Consultabilità
parziale
Data di rilascio
08/10/2049
Riassunto analitico
Nella versione corrente il PRTools presenta una grossa limitazione:<br>non implementa algoritmi di selezione delle features<br>basati su algoritmi evolutivi (né a singolo obiettivo né tantomeno<br>multiobiettivo). Seconda limitazione: la filosofia implementativa<br>di fondo degli algoritmi di classificazione non tiene conto del<br>loro eventuale impiego all’interno di algoritmi di selezione delle<br>caratteristiche e pertanto sono non ottimizzati per lavorare in tale<br>ambito. Detto in altre parole: quando un algoritmo di selezione<br>di features (specialmente se esso è evolutivo) prova una certa combinazione<br>di features, il classificatore impiegato per validarne<br>la bontà viene addestrato ogni volta ex-novo, senza sfruttare<br>eventuali calcoli già fatti precedentemente, relativamente a quel<br>sottoinsieme di features già considerato in precedenti valutazioni.<br>Questo rende tale toolbox poco utilizzabile nel caso di dataset<br>con molte features (» 10).<br>C’è una seconda limitazione: quando la validazione viene fatta<br>in n-fold cross validation, i classificatori non riusano le informazioni<br>calcolate relativamente ai precedenti fold. Questo introduce in<br>tali implementazioni, un ulteriore inefficienza.<br>Per questo motivo è stata proposta una intera nuova interfaccia<br>per routine di selezione delle features, e una nuova interfaccia<br>per l’implementazione di classificatori efficienti. Successivamente<br>è stata implementata ofeatselg, una routine di selezione delle features<br>basata su algoritmi evolutivi multiobiettivo, orientata alla<br>validazione in n-fold cross validation ed il classificatore oknnc,<br>che è un classificatore a minima distanza (k-nearest neighborood),<br>ottimizzato nell’ottica d’uso all’interno di un algoritmo di selezione<br>delle features e in special modo in caso di n-fold cross<br>validation.<br>Gli algoritmi implementati (ofeatselg e oknnc), sono stati testati<br>congiuntamente su di alcuni problemi ingegneristici con ottimi<br>risultati, mostrando una efficienza incomparabile con quella degli<br>algoritmi standard di PRTools. Sfruttando le interfaccie definite<br>per gli algoritmi di selezione delle features ottimizzati (interfaccia<br>ofeatselx, con x iniziale dell’algoritmo) e l’interfaccia per i classificatori<br>ottimizzati da usare in concomitanza (interfaccia oxc, con x<br>nome dell’algoritmo), potranno essere ricreate tutte le funzionalità<br>di PRTools, ma in una versione notevolmente ottimizzata ed<br>efficiente.
File