ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-03302026-203105

Tipo di tesi

Tesi di laurea magistrale

URN

etd-03302026-203105

Titolo

Obstacle Avoidance of a Lunar Rover based on Deep Reinforcement Learning in Autonomous Driving simulator

Dipartimento

INGEGNERIA DELL'INFORMAZIONE

Corso di studi

COMPUTER ENGINEERING

Parole chiave

Artificial Intelligence
Reinforcement Learning

Data inizio appello

15/04/2026

Consultabilità

Non consultabile

Data di rilascio

15/04/2096

Riassunto (Inglese)

This thesis compares two reinforcement learning approaches for autonomous navigation in a simulated environment: SARSA and PPO. Agents are evaluated using shared metrics such as reward, survival, collisions, and distance traveled. PPO achieves more stable performance and better generalization, while SARSA exhibits more conservative behavior that is easier to interpret through Q-table analysis. The work combines quantitative and qualitative evaluation, highlighting strengths and limitations of both methods.

Riassunto (Italiano)

Questa tesi confronta due approcci di reinforcement learning per la navigazione autonoma in ambiente simulato: SARSA e PPO. Gli agenti sono valutati su metriche comuni come reward, sopravvivenza, collisioni e distanza percorsa. PPO mostra prestazioni più stabili e maggiore capacità di generalizzazione, mentre SARSA evidenzia comportamenti più conservativi ma interpretabili tramite l’analisi delle Q-table. Il lavoro integra valutazione quantitativa e qualitativa, discutendo limiti e vantaggi di entrambi gli approcci.

File

Nome file	Dimensione
La tesi non è consultabile. Contatta l’autore