Ein großes Dankeschön an das @xai-Team, das um 2:00 Uhr morgens hart gearbeitet hat, um dies über die Ziellinie zu bringen Wir stellen Agent Runner vor: den ersten Open-Source-Agenten, der mit echten Nutzern betrieben wird, um einen Live-Benchmark für das Programmieren in der realen Welt zu erstellen Wir verfolgen Tool-Aufrufe, erneute Aufforderungen und Mehrdatei-Bearbeitungen, beginnend mit den Besten von @OpenAI, @xai, @GoogleDeepMind, @AnthropicAI, @MistralAI, @Zai_org, @Kimi_Moonshot