Claude Sonnet 5 最重要的事情不是基準測試。 而是當一個 Sonnet 級別的模型以一半的成本達到 Opus 的性能時會發生什麼。 Opus 4.5 在 SWE-Bench 上得分 80.9%。據報導,Sonnet 5 也達到了同樣的標準。 擁有 1M 的上下文窗口。以 Sonnet 的定價。 對於每天運行 Claude Code 8 小時的 vibe 程式設計師來說,這不是一次升級。這是一場成本革命。 你整天使用的模型變得便宜了兩倍,並且可能更快。