MiniMax M2.7 có điểm số thấp hơn M2.5 trên BridgeBench. M2.5 xếp hạng #12. Tổng thể 92.3. M2.7 xếp hạng #19. Tổng thể 88.1. UI giảm từ 76.6 xuống 61.9. Refactor giảm từ 97.3 xuống 90.7. Gen giảm từ 94.3 xuống 89.2. #1 trên Multi-SWE Bench. #19 trên BridgeBench. Đó là sự khác biệt 18 bậc giữa các điểm chuẩn tổng hợp và đánh giá mã thực tế. Đó là lý do tại sao BridgeBench tồn tại.