Shoutout naar het @xai team voor het hard werken om 2:00 uur 's nachts om dit over de finishlijn te brengen Introductie van Agent Runner: de eerste open-source agent harness die wordt uitgevoerd met echte gebruikers om een live benchmark van real-world coding te creëren We traceren tool-aanroepen, herprompting en multifile bewerkingen, te beginnen met het beste van @OpenAI, @xai, @GoogleDeepMind, @AnthropicAI, @MistralAI, @Zai_org, @Kimi_Moonshot