PinchBench-benchmarkit arvioivat tekoälyn suurten kielimallien suorituskykyä OpenClaw-välityspalvelintehtävissä. Tulokset osoittavat, että Gemini 3 Flash johtaa OpenClaw-tehtävien käsittelyssä 95,1 % onnistumisprosentilla, kun taas minimax-m2.1 ja kimi-k2.5 sijoittuvat toiseksi ja kolmanneksi 93,6 %:lla ja 93,4 %:lla. Claude Sonnet 4.5 on 92,7 % ja GPT-4o 85,2 %.