Kami menambahkan Claude-Opus-4.6 ke MathArena! Ini adalah model yang kuat, hanya kedua setelah Gemini-3.1-Pro di sebagian besar tolok ukur. Satu pengecualian: skornya cukup buruk dalam matematika visual. Juga, itu mahal: kami menghabiskan sekitar USD 8.000 untuk menambahkan model, 10x model lain yang pernah kami evaluasi.