Mycket intressanta benchmarkresultat för @openclaw bästa LLM Testet: Procentandel av uppgifter som framgångsrikt slutfördes över standardiserade OpenClaw-agenttester Överraskande resultat för mig är att kimi 2.5 ligger över Anthopic Minimax 2.1 på #3 Al Qwen-modellerna är ganska dåliga