إصدار PPO، وهي فئة جديدة من خوارزميات التعلم المعزز التي تتفوق في مهام الروبوتات المحاكاة: