PPO slop muhtemelen saniyeler içinde bitebilir, bu da sürekli öğrenme için büyük etkiler yaratır. Bugün bile süper insan. Yani, çok aptalca şey işe yarayabilir Belki de tanrı politikası aslında "PPOslop ramework, yeterince CUDA hilesi ile saniyeler içinde bitirmek" şeklindedir.