ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-02042009-094214


Tipo di tesi
Tesi di laurea vecchio ordinamento
Autore
LENCI, ALESSANDRO
URN
etd-02042009-094214
Titolo
Sistemi di classificatori multipli per rilevazione di noduli polmonari in immagini CT
Dipartimento
INGEGNERIA
Corso di studi
INGEGNERIA INFORMATICA
Relatori
Relatore Antonelli, Michela
Relatore Prof. Marcelloni, Francesco
Relatore Prof.ssa Lazzerini, Beatrice
Parole chiave
  • Combinatori
  • Classificatori
  • Segmentazione
  • Cad
Data inizio appello
27/02/2009
Consultabilità
Non consultabile
Data di rilascio
27/02/2049
Riassunto
Abbattere il tasso di mortalità da cancro del polmone e migliorare la qualità della vita dei pazienti saranno gli obiettivi prioritari del prossimo futuro.

La Tomografia Computerizzata (CT) si è imposta quale indagine d'elezione per la diagnosi precoce delle neoplasie polmonari.
La tecnica CT ha conosciuto in questi ultimi anni un'evoluzione culminata con l'applicazione clinica della tecnologia spirale multistrato, che ha reso possibile l'acquisizione di più strati nel corso della medesima rotazione del sistema tubo-detettori, accrescendo sostanzialmente il numero d'immagini prodotte per unità di tempo.
L'introduzione di questa tipologia di apparecchiature ha sensibilmente incrementato la capacità d'identificazione dei noduli polmonari e ha ampliato la possibilità di riconoscere lesioni neoplastiche polmonari in stadi più precoci. Queste considerazioni spiegano l'interesse suscitato dall'introduzione pre-clinica di alcuni sistemi computerizzati di analisi delle immagini, denominati CAD (Computer Aided Detection).

Il riconoscimento automatico dei noduli polmonari con CT è certamente uno dei campi di applicazione al momento più indagati.

I processi previsti dai software dei sistemi CAD prevedono, in realtà, non solo l'identificazione e la localizzazione automatica del nodulo polmonare, ma anche la sua estrapolazione automatica dal background del parenchima polmonare (processo denominato “segmentazione”) ed un'analisi morfologica, densitometrica e volumetrica. In modo significativo la lettera “D” dell'acronimo CAD viene attribuita da alcuni autori a diagnosis piuttosto che semplicemente a detection, volendo enfatizzare che questi software abbiano raggiunto un grado di maturità più consistente di un semplice “suggeritore” di noduli.
Lo scopo non è certo quello di demandare una diagnosi alla macchina, ma quello di elaborare uno strumento tecnologico di supporto finalizzato a migliorare la qualità diagnostica e a minimizzare gli errori dell'interpretazione umana. Ulteriori obiettivi primari sono costituiti dalla possibile riduzione del ricorso a procedure diagnostiche invasive e dalla formulazione di una diagnosi più precoce con conseguente miglioramento della prognosi.

Nel valutare quanto siano accurati i sistemi CAD nell'identificazione dei noduli polmonari possono essere opportune alcune precisazioni preliminari.
In questo contesto devono essere considerati “veri positivi” (pazienti che risultano positivi al test e sono veramente malati) anche i noduli polmonari benigni, anche calcifici, identificati dal CAD, che nella comune terminologia medica possono essere interpretati come “falsi positivi” (pazienti che risultano positivi al test ma che nella realtà sono sani), in quanto non hanno alcuna rilevanza clinica e non richiedono provvedimenti terapeutici.
Vengono considerati al contrario “falsi positivi” dal CAD le pseudo lesioni polmonari, indotte ad esempio da aree fibrotiche, ispessimenti bronchiali ed artefatti di vario tipo.
Sebbene il numero di “falsi positivi” possa essere anche particolarmente consistente non costituisce un reale problema clinico.
Il giudizio interpretativo finale è comunque affidato all'uomo ed in genere questo tipo di “errori” del CAD non crea difficoltà di valutazione. Piuttosto i “falsi positivi” possono ridimensionare gli eventuali benefici del CAD nel ridurre i tempi complessivi di lettura dell'esame ed introdurre un ulteriore onere diagnostio per il radiologo.
L'elemento principale per giudicare l'accuratezza del CAD è costituito dal numero di “falsi negativi” (pazienti che risultano negativi al test ma che nella realtà sono malati) e “falsi positivi”.
I sistemi CAD sono in genere calibrati per ridurre al minimo questi due parametri. La sensibilità del CAD (percentuale di immagini patologiche correttamente classificate) è strettamente correlata ai parametri tecnici di acquisizione dei dati CT: i risultati riportati precedentemente in letteratura, relativi alle prime esperienze con immagini CT di spessori di strato convenzionali (5-10 mm), erano molto deludenti. Lo spessore di strato ha rilievo in quanto gli algoritmi del CAD lavorano prevalentemente su modelli geometrici tridimensionali, che migliorano la loro efficienza con immagini a maggiore risoluzione spaziale.

Il sistema CAD si articola in tre fasi fondamentali: segmentazione, estrazione delle regioni di interesse (ROI) e loro classificazione in “noduli” “non noduli”.

Il nodo centrale di questa tesi è “la classificazione”. In modo più specifico è un sistema basato su due livelli decisionali.
Nel primo livello ognuno dei tre classificatori da noi realizzati utilizza diverse feature (o caratteristiche) per identificare la modellizzazione delle regioni e diversi algoritmi per l’estrazione delle feature. Per ottenere una classificazione esistono due differenti approcci: l'apprendimento supervisionato è una tecnica di apprendimento automatico che mira a istruire un sistema informatico in modo da consentirgli di risolvere dei compiti in automatico (come per il nostro algoritmo sulle reti neurali); oppure l'apprendimento non supervisionato, dove l'appartenenza ad una classe (nodulo/non nodulo) dipende dai dati (come per i due algoritmi Bounding Box e l'indice di forma volumetrico). Ognuno dei tre classificatori da noi realizzati fornisce in output la confidenza di classificazione del pattern rispetto a ciascuna delle due classi (“nodulo” e “non nodulo”) che sarà di ingresso al secondo livello, quello dei combinatori, che si occupa di assimilare le uscite dei classificatori per fonderle, appunto, in un'unica uscita.
Esistono due tipologie di combinatori: quelli “fissi” e quelli “addestrabili”. Mentre i primi operano direttamente sulle uscite dei classificatori, i secondi si basano su un procedimento di assimilazione basato su una funzione di apprendimento automatico.

In questo elaborato abbiamo accreditato ciò che recentemente è stato dimostrato, in teoria e in pratica: cioè che l’utilizzo di combinazioni di classificatori può migliorare, talvolta anche molto marcatamente, le prestazioni di un singolo classificatore, fornendo, nella maggior parte dei casi, soluzioni più accurate e robuste.
File