MiniMax M2.7 wypada gorzej niż M2.5 w BridgeBench. M2.5 zajęło 12. miejsce. Ogólnie 92.3. M2.7 zajęło 19. miejsce. Ogólnie 88.1. UI spadło z 76.6 do 61.9. Refaktoryzacja z 97.3 do 90.7. Gen z 94.3 do 89.2. #1 w Multi-SWE Bench. #19 w BridgeBench. To różnica 18 miejsc między syntetycznymi benchmarkami a rzeczywistymi ocenami kodowania vibe. Dlatego istnieje BridgeBench.