logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-11052024-172637


Tipo di tesi
Tesi di laurea magistrale
URN
etd-11052024-172637
Titolo
Evaluation of Vision Transformers performance in real-time object detection applications for Search and Rescue operations
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
ARTIFICIAL INTELLIGENCE AND DATA ENGINEERING
Parole chiave
  • de:tr
  • detr
  • object detection
  • search and rescue
  • yolo
Data inizio appello
26/11/2024
Consultabilità
Non consultabile
Data di rilascio
26/11/2064
Riassunto (Inglese)
Riassunto (Italiano)
Scopo della tesi è importare un modello di rete neurale pre-addestrato e basato su Vision Transformers (DE:TR, messo a disposizione da META) e di effettuarne il fine tuning in un dataset di Search and Rescue di proprietà dell’azienda. Si andranno a confrontare le prestazioni di tale modello con quelle di modelli più consolidati, basati su reti neurali convoluzionali (nello specifico, YOLO-X). Dopodichè si passerà a valutarne l’utilizzabilità in applicazioni di object detection real-time, per capire se il frame rate è accettabile o meno. In quest’ultima fase verrà utilizzato hardware dedicato (NVIDIA Jetson Orin).
File