Ogłaszamy ARES - nasz otwarty zestaw do badań i oceny Agentic. ARES opiera się na 3 filarach (👇 zobacz wątek), aby ułatwić uczenie przez wzmocnienie dla agentów kodu. Odkryliśmy również, że jest niezwykle przydatny w naszych badaniach nad interpretacją mechanizmów.