MiniMax M2.7 scoort slechter dan M2.5 op BridgeBench. M2.5 gerangschikt als #12. Totaal 92.3. M2.7 gerangschikt als #19. Totaal 88.1. UI daalde van 76.6 naar 61.9. Refactor van 97.3 naar 90.7. Gen van 94.3 naar 89.2. #1 op Multi-SWE Bench. #19 op BridgeBench. Dat is een verschil van 18 rangen tussen synthetische benchmarks en echte vibe coderingsevaluaties. Dit is waarom BridgeBench bestaat.