MiniMax M2.7 scorer dårligere enn M2.5 på BridgeBench. M2.5 rangert som #12. Totalt 92,3. M2,7 rangert som #19. Totalt 88,1. UI falt fra 76,6 til 61,9. Refaktorere fra 97,3 til 90,7. Gen fra 94.3 til 89.2. #1 på Multi-SWE-benken. #19 på BridgeBench. Det er en forskjell på 18 rangeringer mellom syntetiske benchmarks og evalueringer av ekte vibe-koding. Dette er grunnen til at BridgeBench eksisterer.