Tipo di tesi
Tesi di dottorato di ricerca
Titolo
Comparative Analysis of FPGA-based Accelerators for Edge AI in Space Applications
Settore scientifico disciplinare
ING-INF/01 - ELETTRONICA
Corso di studi
INGEGNERIA DELL'INFORMAZIONE
Parole chiave
- accelerator
- ai
- fpga
- satellite
- space
Data inizio appello
25/05/2026
Consultabilità
Non consultabile
Data di rilascio
25/05/2029
Riassunto (Inglese)
The increasing adoption of Artificial Intelligence (AI) in edge and on-board systems, particularly in space applications, has intensified the need for efficient and reliable hardware acceleration solutions. In this context, Field-Programmable Gate Arrays (FPGAs) represent a particularly attractive solution due to their reconfigurability, energy efficiency, and balanced performance. However, the landscape of FPGA-based AI accelerators is characterized by a high degree of architectural heterogeneity and by fundamentally different design paradigms, making fair comparison and informed platform selection a challenging task.
This thesis addresses the problem of evaluating and comparing FPGA-based AI acceleration platforms for edge and space-oriented inference. Rather than focusing exclusively on peak performance, the work emphasizes a broader set of criteria that are critical in space systems, including architectural efficiency, energy consumption, predictability, flexibility, portability, and suitability for deployment in radiation-prone and resource-constrained environments.
To this end, the thesis introduces a structured benchmarking framework that combines quantitative performance and efficiency metrics with qualitative evaluation criteria. The proposed methodology is designed to mitigate platform-dependent biases and to enable a more meaningful comparison across heterogeneous architectures. The framework is applied to a representative set of solutions spanning different design approaches, including programmable overlay accelerators and network-specific architectures generated through automated or semi-automated toolchains.
A central contribution of this work is the in-depth analysis of GPU@SAT, a soft Graphics Processing Unit (GPU) accelerator explicitly conceived for space applications. Through direct access to the Register Transfer Level (RTL) implementation, GPU@SAT is studied at an architectural level, and several enhancements are introduced to improve compliance with the OpenCL execution and memory models. In parallel, a complete development environment, referred to as the GPU@SAT DevKit, is designed and implemented to enable systematic experimentation and reproducible deployment on real hardware. This effort transforms GPU@SAT from a simulation-oriented research prototype into an experimentally evaluable platform.
In addition to GPU@SAT, the thesis investigates a streaming-oriented acceleration approach based on hls4ml and OmpSs-2@FPGA, demonstrating how highly specialized architectures can achieve excellent performance and energy efficiency for selected workloads. Commercial and vendor-supported solutions, including Vitis AI and VectorBlox Software Development Kit (SDK), are also evaluated, together with the automated RTL generation framework FPG-AI, providing a broad view of the current design space.
The experimental evaluation is carried out using two representative Neural Network (NN) workloads, including a space-oriented model, 1D-Justo-LiuNet, which is deployed and measured end-to-end on FPGA-based accelerators for the first time. The results show that no single platform consistently outperforms the others across all metrics. Instead, each architectural approach exhibits distinct strengths and limitations, reflecting inherent trade-offs between flexibility, efficiency, and verifiability.
Overall, this thesis does not aim to promote a single acceleration solution. Rather, it provides a structured methodology and an extensive experimental study that clarifies how different FPGA-based AI acceleration strategies align with specific application requirements and system-level constraints, with particular emphasis on space-oriented on-board inference scenarios.
Riassunto (Italiano)
La crescente adozione dell’intelligenza artificiale (AI) nei sistemi edge e on-board, in particolare nelle applicazioni spaziali, ha intensificato la necessità di soluzioni di accelerazione hardware efficienti e affidabili. In questo contesto, i Field-Programmable Gate Arrays (FPGA) rappresentano una soluzione particolarmente interessante grazie alla loro riconfigurabilità, all’elevata efficienza energetica e alle prestazioni bilanciate. Tuttavia, il panorama degli acceleratori AI basati su FPGA è caratterizzato da un’elevata eterogeneità architetturale e da paradigmi di progettazione profondamente differenti, rendendo complessa una comparazione equa e una selezione consapevole della piattaforma.
Questa tesi affronta il problema della valutazione e del confronto tra piattaforme di accelerazione AI basate su FPGA per l’inferenza edge e per applicazioni spaziali. Piuttosto che concentrarsi esclusivamente sulle prestazioni, il lavoro pone l’accento su un insieme più ampio di criteri critici nei sistemi spaziali, tra cui l’efficienza architetturale, il consumo energetico, la prevedibilità, la flessibilità, la portabilità e l’idoneità ad ambienti soggetti a radiazione e caratterizzati da risorse limitate.
A tale scopo, la tesi introduce un framework strutturato di benchmarking che combina metriche quantitative di prestazioni ed efficienza con criteri di valutazione qualitativa. La metodologia proposta è progettata per mitigare i bias dipendenti dalla piattaforma e consentire un confronto più significativo tra architetture eterogenee. Il framework viene applicato a un insieme rappresentativo di soluzioni che coprono diversi approcci progettuali, includendo acceleratori overlay programmabili e architetture specifiche per rete generate tramite toolchain automatiche o semi-automatiche.
Un contributo centrale di questo lavoro è l’analisi approfondita di GPU@SAT, un acceleratore soft-GPU esplicitamente concepito per applicazioni spaziali. Grazie alla diretta disponibilità dell’implementazione RTL, GPU@SAT viene studiato a livello architetturale e vengono introdotte estensioni per migliorarne la conformità allo standard OpenCL. Parallelamente, è stato progettato e implementato un ambiente di sviluppo completo, denominato GPU@SAT DevKit, che consente una sperimentazione sistematica e riproducibile su hardware reale. Questo lavoro trasforma GPU@SAT da prototipo di ricerca orientato alla simulazione a piattaforma sperimentalmente valutabile.
Oltre a GPU@SAT, la tesi analizza un approccio di accelerazione HLS basato su hls4ml e OmpSs-2@FPGA, dimostrando come architetture specializzate possano ottenere prestazioni ed efficienza energetica di alto livello per workload selezionati. Vengono inoltre valutate soluzioni commerciali e supportate dai vendor, tra cui Vitis AI e VectorBlox SDK, insieme al framework di generazione automatica RTL FPG-AI, offrendo una visione ampia dello stato dell’arte.
La valutazione sperimentale viene condotta utilizzando due reti neurali rappresentative, inclusa una rete orientata allo spazio, 1D-Justo-LiuNet, che viene per la prima volta implementata e misurata end-to-end su acceleratori FPGA. I risultati mostrano che nessuna piattaforma emerge come sistematicamente superiore rispetto alle altre considerando tutte le metriche analizzate. Al contrario, ciascun approccio architetturale presenta specifici punti di forza e limitazioni, riflettendo compromessi intrinseci tra flessibilità, efficienza e verificabilità.
Nel complesso, questa tesi non mira a promuovere una singola soluzione di accelerazione. Essa fornisce invece una metodologia strutturata e uno studio sperimentale esteso che chiariscono come differenti strategie di accelerazione AI basate su FPGA si allineino a specifici requisiti applicativi e vincoli di sistema, con particolare enfasi sugli scenari di inferenza on-board orientati alle applicazioni spaziali.