ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-04102015-164905


Tipo di tesi
Tesi di dottorato di ricerca
Autore
RIGHI, MARCO
Indirizzo email
marco.righi@gmail.com
URN
etd-04102015-164905
Titolo
ANALISI DI IMMAGINI MEDIANTE LA COMBINAZIONE DI METODI DI PATTERN-RECOGNITION E SUPER-RISOLUZIONE
Settore scientifico disciplinare
ING-INF/05
Corso di studi
INGEGNERIA
Relatori
tutor Prof. Marcelloni, Francesco
tutor Dott. Salvetti, Ovidio
tutor Dott. D'Acunto, Mario
Parole chiave
  • Pattern Recognition
  • Image Segmentation
  • Image Analysis
  • Image Segmentation
  • Graph Partitioning Algorithm
  • Super-Resolution
Data inizio appello
03/05/2015
Consultabilità
Non consultabile
Data di rilascio
03/05/2085
Riassunto
I metodi di image analysis affrontano oggi il problema di come migliorare la qualità delle immagini a bassa risoluzione e di come realizzarne un riconoscimento semantico. Le crescenti risorse di calcolo oggi disponibili permettono di ottenere i risultati descritti in questo lavoro quando sono coadiuvate con opportuni metodi per l’elaborazione delle immagini. L’individuazione di questi metodi è un campo di ricerca ancora aperto. Ottenere immagini di qualità è necessario per poter meglio eseguire successive analisi, però per ottenere direttamente immagini o video ad alta risoluzione (High Resolution HR) è necessario utilizzare di dispositivi particolari. Il legame che esiste con il tipo di dispositivo di acquisizione diviene eccessivamente vincolante soprattutto in prospettiva di una diffusione sempre maggiore di dispositivi ubiqui, sempre più economici e con caratteristiche che permettono essenzialmente la produzione di immagini di qualità scadente.
Una soluzione di compromesso è quella di accettare immagini a bassa risoluzione (Low Resolution, LR) e di elaborarle per ottenere immagini ad alta risoluzione. Con alta risoluzione intendiamo qui sia il miglioramento della fedeltà rispetto all’oggetto rappresentato, attraverso l’eliminazione del rumore (denoising) e il miglioramento del contenuto, sia l’aumento della densità dei pixel e dei bit per pixel.
Le tecniche per il miglioramento della risoluzione e l’estrazione delle informazioni dalle immagini si chiamano di super-risoluzione (Super-Resolution). Intuitivamente, l’immagine ad alta risoluzione si ottiene combinando l’informazione non ridondante contenuta in più immagini a bassa risoluzione. Da un punto di vista algoritmico, i metodi di SR generano una denoised hyper-resoluted image (o un insieme di immagini) a partire da una o più immagini LR. Il che non è semplice, dato che le immagini a bassa risoluzione sono spesso degradate dalla point spread function1 (PSF) e dai sistemi di digitalizzazione. Inoltre presentano scarsa informazione spaziale e colorimetrica. La necessità di migliorare la qualità delle immagini a bassa risoluzione spiega perché i metodi di elaborazione della super-risoluzione siano diventati un’area di ricerca rilevante. Particolarmente difficile e quindi interessante è la super-risoluzione single-frame, ovvero la super-risoluzione nel caso in cui l’informazione per il calcolo della nuova immagine ad alta risoluzione proviene da una sola immagine. In generale, gli algoritmi di super-risoluzione si possono infatti classificare in base al numero di immagini in input e in output coinvolte nel processo. Quando si ricava una singola immagine ad alta risoluzione a partire da una singola immagine a bassa risoluzione si parla di super-risoluzione single-image single-output (SISO) o single frame. I problemi in cui viene impiegata questa metodologia sono relativi alle situazioni in cui è possibile ottenere una sola immagine descrittiva.
Quando si ricava una singola immagine ad alta risoluzione a partire da varie immagini a bassa risoluzione si parla di multiple-image single-output (MISO) super-risoluzione o di algoritmi di super-risoluzione statici. Un esempio tipico è il riconoscimento di una targa in un filmato in bassa risoluzione. Quando si ricavano varie immagini ad alta risoluzione a partire da varie immagini a bassa risoluzione si parla infine di super-risoluzione multiple-image multiple-output (MIMO) o video-to-video. In ogni caso, si tratta di super-risoluzione dinamica. I casi MISO e MIMO possono essere genericamente descritti come super-risoluzione multi-frame.
In questo lavoro è studiato il caso della super-risoluzione single-frame. Questa classe di problemi, che permette di lavorare solo su un ristretto numero di informazioni, fornisce la possibilità di entrare in ambiti di applicazione molto estesi: gli scenari infatti spaziano dalle fotografie fatte con un economico smartphone fino a arrivare a immagini acquisite con costosi microscopi a forza atomica (AFM). In generale, il problema della super-risoluzione è un problema mal posto, nel senso della definizione degli anni ’20 (del 900) data da Hadamard [86, 131, 180]. Egli afferma che un modello matematico per un problema fisico (si pensi ad esempio ad un problema al bordo per un’equazione differenziale) deve essere ben posto, vale a dire, deve avere le seguenti proprietà:
- esistenza: il problema ammette una soluzione;
- unicità: esiste al più una soluzione;
- stabilità: la soluzione dipende con continuità dai dati.
I problemi legati alla super-risoluzione sono generalmente problemi mal posti. Questo è vero, in particolare, per la super-risoluzione SISO in quanto l’informazione di partenza è minore rispetto agli altri casi. In altri termini, data un’immagine a bassa risoluzione I esistono molte soluzioni ad alta risoluzione, ovvero, molte immagini che, ridotte,
possono generare I. Per questo motivo in letteratura troviamo solamente alcuni casi specifici in cui si cercano di estendere gli algoritmi di super-risoluzione SISO con reti neurali [214], ad esempio, per il riconoscimento dei volti. Tuttavia la reale efficacia generale di questi algoritmi non è a oggi largamente comprovata eccetto che in casi particolari. Una possibile alternativa è quella di integrare i metodi SR di tipo SISO con i metodi di pattern-recognition (PR) e modellazione in grado di calcolare informazioni aggiuntive sugli oggetti rappresentati per mezzo di una base di conoscenza o Knowlege-base (KB). La risoluzione può essere infatti migliorata se si conosce l’oggetto ripreso dall’immagine e se ne può ricavare un modello. Con pattern-recognition ci si riferisce al processo di classificazione dei dati in oggetti e classi, basato sulla sua capacità di rilevare e identificare le strutture distintive degli oggetti rappresentati. In generale, si tratta di una metodologia molto usata in image analysis per affrontare vari problemi tra i quali: il riconoscimento dei caratteri su carta stampata (detti sistemi OCR), il rilevamento e il riconoscimento dei volti, il rilevamento degli oggetti, il loro riconoscimento e la loro classificazione. Dato che dipendono fortemente dalla qualità delle immagini analizzate, le tecniche PR, a loro volta, possono beneficiare dalla super-risoluzione che consente loro di avere maggiore informazione su cui lavorare. Questa combinazione di tecniche si rivela particolarmente utile negli ambienti con un elevato grado di automazione, nei quali i database sono popolati con immagini di grandi dimensioni che precludono un’elaborazione manuale. Infatti un’elaborazione esaustiva accettabile può avvenire solo per mezzo del calcolo automatico. Inoltre questa analisi, finalizzata a arricchire l’informazione di una singola immagine, può essere proficuamente utilizzata nei sistemi retro-azionati per migliorarne l’efficacia.
File