RL-työkalujen käyttö (Anthropic) on osoittautunut arvokkaammaksi kuin RL-ajattelu (OpenAI).