MiniMax M2.7 má na BridgeBench horší skóre než M2.5. M2.5 na #12. místě. Celkově 92,3. M2.7 na #19. Celkově 88,1. UI kleslo z 76,6 na 61,9. Refaktorujte z 97,3 na 90,7. Gen od 94,3 do 89,2. #1 na Multi-SWE Bench. #19 na BridgeBench. To je rozdíl 18 hodností mezi syntetickými benchmarky a skutečnými hodnoceními vibe kódování. Proto BridgeBench existuje.