logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-04162007-172726


Tipo di tesi
Tesi di laurea specialistica
Autore
Batzu, Pier Domenico
Indirizzo email
pdbatzu@libero.it
URN
etd-04162007-172726
Titolo
Algoritmi per la combinazione di regioni di interesse con applicazione alla rilevazione di noduli polmonari
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
Relatore Cococcioni, Marco
Relatore Prof. Marcelloni, Francesco
Relatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • classifier ensemble
  • combinazione di ROI
  • Computer-Aided Detection
  • Computer-Aided Diagnosis
  • noduli polmonari
  • polmone
  • Region Of Interest
  • regione di interesse
  • rilevazione di ROI
  • ROI
  • ROI ensemble
  • TAC
  • tumore al polmone
  • CAD
  • cluster ensemble
Data inizio appello
09/05/2007
Consultabilità
Non consultabile
Data di rilascio
09/05/2047
Riassunto
Il tumore al polmone rappresenta oggi la principale causa di morte per neoplasia al mondo, ed e' difficilmente guaribile: infatti si stima che la percentuale di sopravvivenza globale a 5 anni vari dal 10% al 15%. E' risaputo, tuttavia, che la sopravvivenza sale al 70-80% se la diagnosi viene effettuata al primo stadio: cio' ha spinto i ricercatori studiare un metodo per la diagnosi precoce del cancro al polmone. Il vero problema di tale approccio e' che nel primo stadio non si hanno normalmente sintomi; pertanto, l'idea e' stata quella di ricorrere a programmi di screening finalizzati ad un controllo sistematico della popolazione a rischio, selezionando quest'ultima in base a fattori come l'eta' ed il numero di sigarette fumate.
Come primo metodo di screening si e' utilizzata la radiografia del torace. Questa tecnica e' stata tuttavia abbandonata nei primi anni Novanta perche' non era in grado di rilevare lesioni polmonari aventi diametro inferiore a 2 cm, soprattutto se situate in posizioni sfavorevoli come dietro il cuore. Una vera rivoluzione nella metodologia di diagnosi precoce si e' avuta con l'avvento della Tomografia Assiale Computerizzata (TAC), in grado di ricostruire il modello tridimensionale dell'interno del corpo umano. I dati raccolti dalla TAC vengono trasmessi ad un calcolatore, che calcola la densita' dei tessuti e fornisce delle immagini in scala di grigio di sezioni ("fette") del corpo.
Le immagini analizzate da un radiologo sono spesso rumorose e, se non analizzate correttamente, possono portare a diagnosi errate. Infatti, alcune volte e' estremamente difficile distinguere i noduli da altre strutture (bronchi, vasi sanguigni, ...), giacche' queste ultime possono avere forma, dimensioni e livello di grigio molto simili ai primi. Per ridurre il rischio di errata rilevazione dei noduli, l'analisi delle immagini di una TAC viene normalmente affidata a piu' radiologi.
Un'efficace alternativa e' costituita da un sistema CAD, ossia un software che puo' essere usato dal radiologo come ausilio per una diagnosi piu' accurata. L'acronimo "CAD" puo' essere interpretato come "Computer-Aided Detection", ossia un sistema in grado di rilevare la presenza di noduli senza distinguerli in maligni o benigni, oppure come "Computer-Aided Diagnosis", ed in tal caso denota un programma che rileva i noduli e fornisce anche al radiologo informazioni utili per discriminarli fra benigni e maligni.
Tutti i sistemi CAD polmonari oggi presenti sul mercato, o ancora in fase di ricerca e progettazione, sono comunque pensati come strumenti d'ausilio al radiologo. Un modo alternativo, ovviamente innovativo, di considerare il CAD consiste nel trasformarlo in un sistema capace di lavorare in maniera completamente autonoma, da vero e proprio "radiologo computerizzato". In tal caso, il sistema dovra' automaticamente individuare i lobi polmonari all'interno di ciascuna immagine della TAC, per poi rilevare in esse le regioni di interesse ("Regions Of Interest" o ROI), corrispondenti il piu' possibile ai noduli polmonari.
In questo lavoro ci siamo concentrati proprio sul problema della rilevazione e classificazione dei noduli, ed abbiamo studiato, in particolare, un metodo utile per aumentare l'accuratezza della rilevazione e della classificazione delle regioni d'interesse. L'approccio utilizzato imita la metodologia d'analisi delle TAC da parte di piu' radiologi in parallelo; nel nostro sistema, tuttavia, i "radiologi" non sono uomini, ma sono bensi' software che ricercano le ROI nelle immagini digitalizzate. L'uso di questo metodo parte dal presupposto che una classificazione di gruppo delle ROI sulle stesse immagini produce risultati migliori di quella fatta dal singolo.
Il sistema CAD da noi implementato e' in grado, in particolare, di affidare la ricerca e classificazione delle ROI (in "noduli" e "non-noduli"), a partire dalle stesse immagini TAC 2D o 3D, a piu' algoritmi di rilevazione di ROI, e di combinare le varie classificazioni ottenute da tali rilevatori. Alla parte del sistema dedicata alla fase di combinazione delle ROI abbiamo dato il nome di "generatore di ROI". Una caratteristica importante del generatore e' che esso puo' essere addestrato a partire dalle classificazioni di un radiologo umano; in tal modo adatta le sue modalita' di combinazione delle regioni d'interesse a quelle che avrebbe utilizzato il radiologo stesso. Completato il training, il generatore e' in grado di lavorare autonomamente, senza piu' l'ausilio del radiologo.
Nella nostra analisi, abbiamo sottolineato le forti differenze fra la combinazione di ROI ("ROI ensemble") ed altri due problemi, gia' ampiamente studiati, detti "classifier ensemble" e "cluster ensemble". Al fine di ricondurre la combinazione di ROI a tali problemi, abbiamo elaborato un nuovo metodo di fusione di regioni d'interesse, che sfrutta alcuni risultati ottenuti con la Teoria dei Grafi, ed abbiamo ideato una procedura di cross-validazione innovativa, completamente distribuita fra i rilevatori di ROI. Grazie in particolare alla cross-validazione, il sistema e' in grado di rimuovere la maggior parte dei falsi positivi (non-noduli erroneamente classificati come noduli) dalle classificazioni operate dai rilevatori. Nel progettare il CAD, la procedura di cross-validazione e' stata addirittura realizzata in varie versioni, ciascuna delle quali sfrutta un algoritmo differente: voto a maggioranza, Behaviour-Knowledge Space, k Nearest Neighbour, reti neurali MLP.
Il sistema e' stato implementato come una libreria per MATLAB, costituita da circa 100 funzioni. I risultati ottenuti mostrano l'enorme efficacia del metodo di decisione multipla, in particolare in termini di stabilita' ed immunita' ai disturbi. Le prestazioni migliorano ancor piu' se si suddivide il polmone in diverse zone e si analizzano le immagini di ciascuna regione con un sistema differente.
Uno sviluppo futuro del sistema CAD dovra' riguardare, in particolare, lo studio di nuovi metodi di cross-validazione. Al fine di estendere il dominio di corretto funzionamento a tutte le tipologie di pazienti, sara' inoltre necessario eseguire un addestramento con immagini TAC di piu' persone, magari con caratteristiche diversificate. Infine, i rilevatori ed il generatore di ROI dovranno essere integrati in un sistema CAD piu' ampio, comprendente il segmentatore delle TAC (per la separazione dei polmoni dalle strutture anatomiche circostanti) e gli estrattori di caratteristiche ("features") dalle ROI. Tale integrazione dovra' essere accompagnata dalla costruzione di un'interfaccia grafica che rispetti i piu' comuni criteri d'usabilita', in modo da consentire un uso semplificato del sistema da parte di qualunque utente.
File