AWS DeepRacer: Model # 5

AWS DeepRacer maakt gebruik van Amazon SageMaker om het model achter de schermen te trainen en gebruikt AWS RoboMaker om de interactie van de agent met de omgeving te simuleren. Bekijk hoe de agent zich gedraagt ​​in de gekozen omgeving, zoals voorgeschreven door de beloningsfunctie.

Trainingsconfiguratie

Beloningsgrafiek

In dit diagram wordt de totale beloning per aflevering in de loop van de tijd weergegeven. Geef n een track en een beloningsfunctie, de totale beloning passeert een bepaalde drempel wanneer de agent een ronde voltooit. Als de totale beloning in je training consequent de drempel overschrijdt, is het model waarschijnlijk geconvergeerd. De totale beloning fluctueert als gevolg van willekeurige acties die de agent onderneemt voor verkenning. Model iteratiekiezer stelt AWS DeepRacer-simulatie in staat om tussen training en checkpoint-evaluaties te wisselen tot het einde van de trainingstaak.

Huidige positie in de AWS DeepRacer League met dit model 469/1381