Un saludo a @xai equipo por esforzarse a las 2:00 de la madrugada para ayudar a que esto se cierre Presentamos Agent Runner: el primer gestor de código abierto ejecutado con usuarios reales para crear un benchmark en tiempo real de programación del mundo real Rastreamos llamadas a herramientas, reprompting y ediciones multiarchivo, empezando por lo mejor de @OpenAI, @xai, @GoogleDeepMind, @AnthropicAI, @MistralAI, @Zai_org, @Kimi_Moonshot