Denne artikkelen er nesten for god til at jeg ikke ville dele den Ignorer OpenClaws clickbait, OPD + RL på ekte agentiske oppgaver med betydelige resultater er veldig spennende, og gjør at vi ikke trenger verifiserbare belønninger Forfattere: @YinjieW2024 Xuyang Chen, Xialong Jin, @MengdiWang10 @LingYang_PU