MiniMax M2.7 obtient un score inférieur à M2.5 sur BridgeBench. M2.5 classé #12. Global 92.3. M2.7 classé #19. Global 88.1. L'UI est passée de 76.6 à 61.9. Refactor de 97.3 à 90.7. Gen de 94.3 à 89.2. #1 sur Multi-SWE Bench. #19 sur BridgeBench. C'est une différence de 18 rangs entre les benchmarks synthétiques et les évaluations de codage en conditions réelles. C'est pourquoi BridgeBench existe.