logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-12152024-165800


Tipo di tesi
Tesi di laurea magistrale
Autore
CRUGLIANO, FLAVIO PIO
URN
etd-12152024-165800
Titolo
FRUGAL ARTIFICIAL INTELLIGENCE: RICONOSCIMENTO E CLASSIFICAZIONE AUTOMATICA DI IMMAGINI E VIDEO E/O IR CON LIMITATI DATA SET CASE STUDY DEL PROGRAMMA U212 NFS.
Dipartimento
SCIENZE POLITICHE
Corso di studi
SCIENZE MARITTIME E NAVALI
Relatori
relatore C.C. (AN) Di Paola, Vitantonio
correlatore C.F. (AN) Cardillicchia, Alain
Parole chiave
  • AI
  • CNN
  • frugal artificial intelligence
  • periscopio
  • reti neurali
  • sommergibili
  • yolo
Data inizio appello
16/01/2025
Consultabilità
Tesi non consultabile
Riassunto
Durante l’ultimo decennio, l’avanzamento tecnologico ha permesso di utilizzare con efficacia le reti neurali profonde, introdotte nelle sue versioni “primitive” già durante gli anni 80.
Note in letteratura come Deep Learning Neural Networks, tali modelli sono stati specializzati in differenti ambiti applicativi come ad esempio il riconoscimento delle immagini (Reti Convoluzionali - CNN), l’analisi di serie temporali (Reti Ricorrenti - RNN), la generazione di immagini e testi (Reti Generative - GAN), la comprensione del linguaggio naturale e la traduzione automatica istantanea (Reti Transformer), etc., ridando nuova vita al campo del Machine Learning e permettendo di risolvere problemi complessi che fino a poco tempo prima non sembravano affrontabili in maniera automatica. Come rovescio della medaglia degli eccezionali risultati ottenuti, la complessità delle problematiche affrontate richiede che le reti neurali profonde siano addestrate con una elevata quantità di dati di esempio che implica, insieme alla complessità delle architetture proposte, un notevole sforzo sia in termini di raccolta e preparazione dei dati da utilizzare per l’addestramento che in termini computazionali (e di conseguenza un elevato dispendio sia energetico che temporale). Ne consegue quindi che in alcuni particolari ambiti applicativi, laddove siano limitate la disponibilità dei dati in input oppure la disponibilità di potenza di calcolo, il Machine Learning non risulti di facile applicabilità.
L'intelligenza artificiale frugale (Frugal AI) è una disciplina che cerca di superare le problematiche appena introdotte e si pone come scopo lo sviluppo di sistemi di Machine Learning che siano efficienti, sia in termini di risorse di calcolo richieste, che in termini di mole di dati necessari per la fase di addestramento.
In letteratura, la Frugal AI si concentra prevalentemente sui seguenti 3 ambiti:
• Active Learning: tecnica di apprendimento automatico in cui un modello viene addestrato con un set minimale di dati iniziali; in una seconda fase il sistema seleziona in modo autonomo i campioni da utilizzare per finalizzare il training (che devono essere etichettati manualmente da un esperto umano). In questo modo, il modello può apprendere in modo più efficiente utilizzando solamente dati rilevanti, riducendo il tempo e le risorse necessarie per l'addestramento.
• Efficiency Environment: si riferisce alla progettazione di sistemi di apprendimento automatico che siano efficienti in termini di risorse, sia dal punto di vista del tempo di esecuzione che dell'utilizzo della memoria. Ciò è particolarmente importante in ambienti con risorse limitate, come ad esempio dispositivi mobili o sistemi embedded, dove la potenza di calcolo e la memoria a disposizione sono limitate.
• Transfer Learning: tecnica di apprendimento automatico in cui un modello già addestrato su un particolare ambito viene utilizzato come punto di partenza per addestrare un nuovo modello su un ambito similare. In questo modo, il nuovo modello può utilizzare le conoscenze apprese dal modello addestrato precedentemente, riducendo i tempi e le risorse necessarie per l'addestramento.
Questo elaborato si concentrerà principalmente sulla tecnica del Transfer Learning, riportando ed analizzando diversi studi scientifici proposti in letteratura e studiandone la sua applicabilità nell'ambito del programma U-212.
Nel contesto in cui i sottomarini operano (condizioni ambientali difficili e spesso con una visibilità limitata), la capacità di rilevare rapidamente e con precisione oggetti, strutture e altre informazioni ambientali è fondamentale per la sicurezza dell'equipaggio e per la riuscita delle missioni.
Date queste premesse, ne consegue che risulta difficile collezionare una mole di dati sufficiente da utilizzare per addestrare dei modelli di reti neurali profonde e, per questo motivo, l’utilizzo di tecniche quali il Transfer Learning potrebbe fornire un valore aggiunto per raggiungere le performance desiderate.
Questa tecnica infatti permetterebbe di addestrare modelli di riconoscimento automatico di immagini da periscopio, utilizzando come base di partenza modelli addestrati su ambiti simili, ad esempio utilizzando immagini di navi provenienti da altre fonti (e quindi riprese da angoli di visuale diversa rispetto ad un periscopio), come ad esempio piattaforme navali e/o piattaforme aeree.
In tal senso, l’obiettivo di questa tesi è quello di sviluppare un algoritmo capace di identificare componenti critici delle unità navali, come il proprio sistema d’armamento (ad esempio, cannoni) e apparati sensoriali (come antenne radar), partendo da un modello già esistente di riconoscimento di oggetti, ovvero YOLO.
YOLO (You Only Look Once) è un modello molto utilizzato nell’ambito del riconoscimento di oggetti e persone all’interno di immagini e video, grazie alla sua capacità di elaborare e produrre risultati in tempi molto brevi.
Utilizzando l'ultima versione del modello YOLO, un dataset open-source composto da immagini di unità navali, con particolare riferimento alle sovrastrutture che ospitano armamenti, sistemi di navigazione, comunicazione e guerra elettronica, viene impiegato per addestrare e adattare l'algoritmo al riconoscimento di questi nuovi elementi.
Il modello addestrato verrà successivamente validato su un set di immagini classificate, al fine di verificarne le performance in termini di precisione, recall e capacità di rilevazione.
Al fine di generare un modello altamente performante, è necessario avere un numero elevato di immagini ad alta risoluzione, ma viste le caratteristiche di YOLO è possibile ottenere risultati quantomeno soddisfacenti anche con un dataset di dimensioni moderate, senza compromettere significativamente la precisione nel riconoscimento degli asset navali tattico/strategici.
File