logo SBA

ETD

Archivio digitale delle tesi discusse presso l’Università di Pisa

Tesi etd-06082020-225449


Tipo di tesi
Tesi di laurea magistrale
Autore
PERAZ, GIULIANO
Indirizzo email
g.peraz@studenti.unipi.it, giuliano.peraz@gmail.com
URN
etd-06082020-225449
Titolo
Realizzazione di un testbed per Target Search tramite Reinforcement Learning basato su Computational Stigmergy e Multi-Agent Policy Gradients
Dipartimento
INGEGNERIA DELL'INFORMAZIONE
Corso di studi
COMPUTER ENGINEERING
Relatori
relatore Cimino, Mario Giovanni Cosimo Antonio
relatore Vaglini, Gigliola
relatore Galatolo, Federico Andrea
Parole chiave
  • target search
  • stigmergia
  • reinforcement learning
  • multiagente
  • testbed
Data inizio appello
22/06/2020
Consultabilità
Completa
Riassunto
La tesi riguarda la realizzazione di un simulatore in grado di fornire un ambiente per il coordinamento di sciami di agenti: essi si muovono alla ricerca di target all'interno dell'ambiente, cercando degli obiettivi e provando ad evitare ostacoli nel loro percorso. Questo simulatore supporta la stigmergia, cioè gli agenti possono rilasciare delle tracce, dette feromoni, quando vedono degli elementi di interesse nell'ambiente. Sono stati condotti esperimenti utilizzando Multi-Agent Policy Gradients.
File