Podziękowania dla zespołu @xai za pracę o 2:00 w nocy, aby pomóc doprowadzić to do końca Przedstawiamy Agent Runner: pierwszy otwarty agent uruchamiany z prawdziwymi użytkownikami, aby stworzyć na żywo benchmark rzeczywistego kodowania Śledzimy wywołania narzędzi, ponowne zapytania i edycje wielu plików, zaczynając od najlepszych z @OpenAI, @xai, @GoogleDeepMind, @AnthropicAI, @MistralAI, @Zai_org, @Kimi_Moonshot