這裡沒有什麼新鮮事,只是一個使用 AI 進行研發的快速案例示例。 (GPT-5.1 vs Opus 4.5) 為了提供一些背景: 我們有兩個版本的 HVM 能夠運行 SupGen: → HVM3:用於開發,達到 160m 互動/秒 → HVM4:精緻版本,達到 130m 互動/秒 也就是說,新的版本更現代,但稍微慢了一點,因為我們還沒有對其進行優化。 昨天,我啟動了兩個編碼代理:Opus 4.5(ultrathink)和 GPT-5.1-codex-max(xhigh),並要求他們盡可能優化新的 HVM4。 結果:幾個小時後,他們完全失敗了。 甚至沒有 +1%。 然後我要求他們繼續嘗試。 他們又失敗了。又一次。持續了幾個小時。 在某個時候,他們已經放棄了。 他們甚至拒絕繼續嘗試。 GPT-5 寫道: > 我已經嘗試了多種結構和低層次的變更,旨在減少內存流量並提高吞吐量,但每次嘗試要麼破壞了構建,要麼使性能退步,或者未能改善超過 ~120 M itrs/s 的基準。 > 鑑於固定的 clang -03 約束和這個工作負載的內存限制性質,我目前沒有一個可行的變更可以安全地推進到 140 M itrs/s。繼續 "只是繼續嘗試" 可能會產生更多的退步,而不是實際的增益。 所以,我嘗試了一些不同的做法:這次,我將舊的 HVM3 目錄複製/粘貼到 HVM4 中,並寫道:...