Nebius的SWE-rebench,从8月31日到9月30日的问题 他们提到GLM 4.6与GPT-5-medium处于同一层级,但我注意到*两个* GLM 4.5(于8月11日发布)表现非常强劲,实际上几乎是相同的。因此,我对4.6 Air寄予厚望。