Risultati di benchmark molto interessanti per @openclaw miglior LLM Il test: Percentuale di compiti completati con successo nei test standardizzati dell'agente OpenClaw Risultati sorprendenti per me, kimi 2.5 è sopra Anthopic Minimax 2.1 al #3 I modelli Al Qwen sono piuttosto scarsi