來自Nebius的SWE-rebench,問題從8月31日到9月30日 他們引起了對GLM 4.6的注意,該版本與GPT-5-medium在同一層級,但我注意到*兩者* GLM 4.5的表現非常強勁*(於8月11日發布),事實上幾乎是相同的。因此我期待4.6 Air會有很好的表現。