Ten artykuł jest prawie zbyt dobry, żebym chciał się nim dzielić Zignorujcie clickbait OpenClaw, OPD + RL w rzeczywistych zadaniach agentowych z znaczącymi wynikami jest bardzo ekscytujące i odsuwa nas od potrzeby weryfikowalnych nagród Autorzy: @YinjieW2024 Xuyang Chen, Xialong Jin, @MengdiWang10 @LingYang_PU