MiniMax M2.7 schneidet schlechter ab als M2.5 bei BridgeBench. M2.5 belegte Platz #12. Insgesamt 92,3. M2.7 belegte Platz #19. Insgesamt 88,1. UI fiel von 76,6 auf 61,9. Refactor fiel von 97,3 auf 90,7. Gen fiel von 94,3 auf 89,2. #1 bei Multi-SWE Bench. #19 bei BridgeBench. Das ist ein Unterschied von 18 Rängen zwischen synthetischen Benchmarks und realen Vibe-Coding-Bewertungen. Deshalb existiert BridgeBench.