logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-11052024-172637


Tipo di tesi
Tesi di laurea magistrale
Autore
LONDRETTI, FRANCESCO
URN
etd-11052024-172637
Titolo
Evaluation of Vision Transformers performance in real-time object detection applications for Search and Rescue operations
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
ARTIFICIAL INTELLIGENCE AND DATA ENGINEERING
Relatori
relatore Prof. Cococcioni, Marco
relatore Dott. Camarlinghi, Niccolò
Parole chiave
  • de:tr
  • detr
  • object detection
  • search and rescue
  • yolo
Data inizio appello
26/11/2024
Consultabilità
Non consultabile
Data di rilascio
26/11/2064
Riassunto
Scopo della tesi è importare un modello di rete neurale pre-addestrato e basato su Vision Transformers (DE:TR, messo a disposizione da META) e di effettuarne il fine tuning in un dataset di Search and Rescue di proprietà dell’azienda. Si andranno a confrontare le prestazioni di tale modello con quelle di modelli più consolidati, basati su reti neurali convoluzionali (nello specifico, YOLO-X). Dopodichè si passerà a valutarne l’utilizzabilità in applicazioni di object detection real-time, per capire se il frame rate è accettabile o meno. In quest’ultima fase verrà utilizzato hardware dedicato (NVIDIA Jetson Orin).
File