SWE-rebench dari Nebius, masalah dari 31 Agustus hingga 30 Sep Mereka menarik perhatian ke GLM 4.6 yang berada di tingkat yang sama dengan GPT-5-medium, tetapi saya melihat kinerja yang sangat kuat oleh *kedua* GLM 4.5* (dirilis 11 Agustus), sebenarnya hampir identik. Jadi saya mengharapkan hal-hal hebat dari 4.6 Air.