Un grande saluto al team di @xai per il duro lavoro alle 2:00 del mattino per aiutarci a portare a termine questo progetto Presentiamo Agent Runner: il primo agente open-source eseguito con utenti reali per creare un benchmark dal vivo del coding nel mondo reale Tracciamo le chiamate agli strumenti, le ripetizioni e le modifiche su più file, partendo dai migliori di @OpenAI, @xai, @GoogleDeepMind, @AnthropicAI, @MistralAI, @Zai_org, @Kimi_Moonshot