MiniMax M2.7 ha ottenuto punteggi peggiori rispetto a M2.5 su BridgeBench. M2.5 si è classificato al #12. Punteggio complessivo 92.3. M2.7 si è classificato al #19. Punteggio complessivo 88.1. L'UI è scesa da 76.6 a 61.9. Refactor da 97.3 a 90.7. Gen da 94.3 a 89.2. #1 su Multi-SWE Bench. #19 su BridgeBench. C'è una differenza di 18 posizioni tra i benchmark sintetici e le valutazioni di codifica reali. Ecco perché esiste BridgeBench.