Skor MiniMax M2.7 lebih buruk daripada M2.5 di BridgeBench. M2.5 peringkat #12. Keseluruhan 92.3. M2.7 peringkat #19. Keseluruhan 88,1. UI turun dari 76,6 menjadi 61,9. Refaktor dari 97,3 menjadi 90,7. Gen dari 94.3 hingga 89.2. #1 di Bangku Multi-SWE. #19 di BridgeBench. Itu adalah perbedaan peringkat 18 antara tolok ukur sintetis dan evaluasi pengkodean getaran nyata. Inilah sebabnya mengapa BridgeBench ada.