ETD

Archivio digitale delle tesi discusse presso l'Università di Pisa

Tesi etd-06122022-103955


Tipo di tesi
Tesi di laurea magistrale
Autore
ADORNO, FRANCESCA
URN
etd-06122022-103955
Titolo
Smoke detection per un sistema di monitoraggio industriale basata su una rete neurale
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
INGEGNERIA ROBOTICA E DELL'AUTOMAZIONE
Relatori
relatore Prof.ssa Pallottino, Lucia
Parole chiave
  • EfficienteDet
  • EfficientNet
  • rete neurale convoluzionale
  • smoke detection
Data inizio appello
07/07/2022
Consultabilità
Non consultabile
Data di rilascio
07/07/2025
Riassunto
Il presente lavoro di tesi ha come scopo il rilevamento di fumi per un sistema di monitoraggio industriale. Tale attività è stata svolta nell’ambito di un tirocinio presso la ditta Sigma Ingegneria S.r.l. di Lucca.
La piattaforma in questione è composta da un carrello, capace di muoversi su un binario, e da un drone aereo, in grado di sollevare carichi utili rilevanti.
Nell’elaborato si considera esclusivamente il carrello.
Una prima analisi preliminare sulla sensoritista a bordo carrello ha portato alla scelta di due sensori per la qualità dell’aria e di due sensori di visione, quali una termocamera e una stereocamera, entrambe dotate di sensori RGB, su cui si è posta l’attenzione.
Per il raggiungimento dell’obiettivo di rilevamento dei fumi la preferenza è ricaduta sull’utilizzo delle reti neurali artificiali.
La progettazione della rete avviene in diverse fasi: scelta del task, scelta del modello, creazione del dataset, configurazione delle impostazioni, addestramento della rete e, infine, la detection.
A seconda del tipo di obiettivo da raggiungere le reti neurali possono svolgere vari tipi di task, nello specifico il rilevamento dei fumi rientra nel task del rilevamento.Il fulcro del lavoro è stato la scelta di un modello pre-addestrato, costruito su una specifica famiglia di modelli di reti neurali convoluzionali, chiamata EfficientDet.
Le reti neurali, in linea generale, sono una famiglia di reti neurale utilizzate per il riconoscimento delle immagini. La loro peculiarità è la presenza dei livelli di convoluzione, i quali estraggono, attraverso l’uso dei filtri, delle caratteristiche dell’immagine. Nel dettaglio la famiglia delle EfficientDet, costruita sulla EfficientNet, sono una nuova famiglia di metodi per il rilevamento degli oggetti, ottimizzate dall’utilizzo del compound scaling method, che permette di scalare il modello da un modello base a modelli più efficienti e dei blocchi piramidali bidirezionali, che permettono, invece, il fluire delle informazioni in due direzioni, dall’alto verso il basso e dal basso verso l’alto. La creazione del dataset è avvenuta in più fasi. Il dataset di partenza è stato fornito dall’Università degli studi di San Diego, costituito da un set di foto di incendi. La necessità di ampliare i campi di rilevamento dei fumi a vari ambienti, che spaziano dall’outdoor all’indoor, da situazioni diurne con luminosità più o meno accentuata a condizioni notturne, ha portato ad un aumento personalizzato del dataset. Tale procedura è avvenuta in più step e in vari contesti e stagioni, tramite video realizzati presso alcune cartiere di Capannori e di Porcari, e altri video, fatti, invece, presso la Sigma Ingegneria di Lucca con l’ausilio di una macchina del fumo e di un fumogeno bianco.
Dall’acquisizione video sono state ricavate le immagini, all'interno delle quali sono state scontornate manualmente le nuvole di fumo, per consentire l'etichettatura. Tale procedura è stata eseguita con un apposito software open-source, chiamato Roboflow. Inoltre, grazie ad una specifica funzionalità, che permette di aumentare l’esposizione e la luminosità delle immagini con valori settati manualmente, si è incrementato ulteriormente lo stesso dataset. Una volta creato il dataset per l’addestramento della rete è possibile esportarlo nel formato voluto.
Con la configurazione si analizzano gli strumenti su cui si basa il modello, nel nostro caso specifico, il framework TensorFlow e la sua API di Object Detection e le impostazioni, che influiscono sulla perfomance della rete, quali parametri e iperparametri. Tra gli iperparametri si è posta l’attenzione su numero di epoche, batch size e numero di passi per epoca. La valutazione di questi valori è avvenuta in maniera empirica. Provando varie combinazioni, infatti, il risultato raggiunto è il miglior compromesso tra prestazione del training e limiti computazionali, dovuti sia al compilatore utilizzato sia alla durata della fase di addestramento.
La fase finale della detection viene suddivisa, a sua volta, in diverse fasi. Nella prima fase di acquisizione, tramite la funzione VideoCapture, propria di OpenCV, è stato possibile acquisire video e i frame acquisiti sono stati poi convertiti in tensori di input per il rilevamento. Nella fase successiva si applica un filtro per permettere il rilevamento, anche dei fumi scuri.
Esso è rappresentato da un’operazione di inversione dell’immagine, che rielabora l’immagine nel formato standard RGB costruendone il negativo. Nella ultima fase, tramite una funzione specifica dell’API Object Detection si creano i box attorno all’oggetto da rilevare e i risultati vengono, poi, visualizzati a schermo.
L’efficienza del modello viene valutata in base a due criteri di valutazione: la presenza dei falsi positivi e/o negativi e le modalità di rilevamento.
Più falsi positivi, ovvero più oggetti che sono fumo, ma che vengono rilevati come tali, sono presenti minore sarà la resa del rilevamento dei fumi.
In particolare, è stato scelto di suddividere le modalità di rilevamento in tre categorie: rilevamento continuo, in cui il rilevamento avviene per un numero consistente di frame, senza evidenti discontinuità, rilevamento intermittente, in cui il rilevamento avviene per alcuni frame con pause brevi ed infine rilevamento discontinuo, in cui il rilevamento avviene per pochi frame con pausa più lunghe.
Al fine di eseguire una campagna di test semplice, ma al tempo stesso rappresentativa del contesto di applicazione di questo sistema di monitoraggio, il modello è stato provato nella realtà produttiva di Sigma Ingegneria, e in ambiente casalingo, sia outdoor che indoor, al fine di aumentare le casistiche di valutazione del modello.
I contesti analizzano si differenziano in diurni, notturni e outdoor con condizioni diverse di luminosità e presenza di vari oggetti esterni.
In tutti i casi il fumo viene rilevato, ma con continuità variabile. Inolre si nota una certa presenza di falsi positivi e negativi, dovuta a diversi fattori ambientali.
In conclusione, il modello proposto raggiunge l’obiettivo in maniera quasi ottimale ed i suoi limiti possono essere superati tramite dei miglioramenti, sia in termini di efficienza stessa del modello della famiglia EfficientDet, sia in termini di strumentistica computazionale, quale il compilatore impiegato, e qualitativa della progettazione della rete neurale, come ampliamento ulteriore del dataset in altri e più vari contesti.
Quindi, tra gli obiettivi futuri previsti dal progetto, oltre ad un miglioramento negli strumenti computazionale e qualitativo, si è previsto l’utilizzo di un framework diverso da TensorFlow. Il confronto tra framework permette di poter testare il modello di rilevamento su basi differenti, in modo da valutarne eventuali miglioramenti o peggioramenti in termini di efficienza.
File