تقيم معايير PinchBench أداء نماذج اللغة الكبيرة للذكاء الاصطناعي في مهام البروكسي OpenClaw. تظهر النتائج أن Gemini 3 Flash يتصدر الطريق بنسبة نجاح 95.1٪ في معالجة مهام OpenClaw، بينما يحتل minimax-m2.1 وkimi-k2.5 المرتبة الثانية والثالثة بنسبة 93.6٪ و93.4٪ على التوالي. كلود سونيت 4.5 بنسبة 92.7٪، وGPT-4o بنسبة 85.2٪.