MiniMax M2.7, BridgeBench'te M2.5'ten daha kötü puan alıyor. M2.5 sıralaması #12. Genel olarak 92.3. M2.7 sıralaması #19 oldu. Genel olarak 88.1. Kullanıcı arayüzü 76.6'dan 61.9'a düştü. 97.3'ten 90.7'ye refactor. Gen 94.3'ten 89.2'ye kadar. Multi-SWE Bench'te #1. BridgeBench'te #19. Bu, sentetik benchmarklar ile gerçek vibe kodlama değerlendirmeleri arasında 18 derece farkı demek. İşte bu yüzden BridgeBench var.