logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-03302026-203105


Tipo di tesi
Tesi di laurea magistrale
URN
etd-03302026-203105
Titolo
Obstacle Avoidance of a Lunar Rover based on Deep Reinforcement Learning in Autonomous Driving simulator
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
COMPUTER ENGINEERING
Parole chiave
  • Artificial Intelligence
  • Reinforcement Learning
Data inizio appello
15/04/2026
Consultabilità
Non consultabile
Data di rilascio
15/04/2096
Riassunto (Inglese)
This thesis compares two reinforcement learning approaches for autonomous navigation in a simulated environment: SARSA and PPO. Agents are evaluated using shared metrics such as reward, survival, collisions, and distance traveled. PPO achieves more stable performance and better generalization, while SARSA exhibits more conservative behavior that is easier to interpret through Q-table analysis. The work combines quantitative and qualitative evaluation, highlighting strengths and limitations of both methods.
Riassunto (Italiano)
Questa tesi confronta due approcci di reinforcement learning per la navigazione autonoma in ambiente simulato: SARSA e PPO. Gli agenti sono valutati su metriche comuni come reward, sopravvivenza, collisioni e distanza percorsa. PPO mostra prestazioni più stabili e maggiore capacità di generalizzazione, mentre SARSA evidenzia comportamenti più conservativi ma interpretabili tramite l’analisi delle Q-table. Il lavoro integra valutazione quantitativa e qualitativa, discutendo limiti e vantaggi di entrambi gli approcci.
File