Sehr interessante Benchmark-Ergebnisse für @openclaw beste LLM Der Test: Prozentsatz der erfolgreich abgeschlossenen Aufgaben bei standardisierten OpenClaw-Agententests Überraschende Ergebnisse für mich, kimi 2.5 liegt über Anthropic Minimax 2.1 auf Platz #3 Al Qwen-Modelle sind ziemlich schlecht