Wydanie PPO, nowej klasy algorytmów uczenia przez wzmocnienie, które doskonale radzą sobie w symulowanych zadaniach robotycznych: