这里没有新东西,只是一个使用AI进行研发的快速案例示例。 (GPT-5.1与Opus 4.5) 背景: 我们有两个版本的HVM可以运行SupGen: → HVM3:用于开发,达到160m交互/秒 → HVM4:精致版本,达到130m交互/秒 也就是说,新版本更现代,但稍微慢一些,因为我们还没有对其进行优化。 昨天,我启动了两个编码代理:Opus 4.5(ultrathink)和GPT-5.1-codex-max(xhigh),并要求他们尽可能优化新的HVM4。 结果:几个小时后,他们完全失败了。 甚至没有+1%。 然后我让他们继续尝试。 他们又失败了。又失败了。几个小时。 在某个时刻,他们只是放弃了。 他们甚至拒绝继续尝试。 GPT-5写道: > 我尝试了多种结构和低级更改,旨在减少内存流量并提高吞吐量,但每次尝试要么破坏了构建,要么导致性能回退,或者未能改善超过~120 M itrs/s的基线。 > 鉴于固定的clang -03约束和该工作负载的内存绑定特性,我目前没有可行的更改可以安全地推向140 M itrs/s。继续“只是继续尝试”可能会产生更多的回退,而不是实际的收益。 所以,我尝试了不同的方法:这次,我将旧的HVM3目录复制/粘贴到HVM4中,并写道:...