一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

这里没有新东西，只是一个使用AI进行研发的快速案例示例。（GPT-5.1与Opus 4.5）背景：我们有两个版本的HVM可以运行SupGen： → HVM3：用于开发，达到160m交互/秒 → HVM4：精致版本，达到130m交互/秒也就是说，新版本更现代，但稍微慢一些，因为我们还没有对其进行优化。昨天，我启动了两个编码代理：Opus 4.5（ultrathink）和GPT-5.1-codex-max（xhigh），并要求他们尽可能优化新的HVM4。结果：几个小时后，他们完全失败了。甚至没有+1%。然后我让他们继续尝试。他们又失败了。又失败了。几个小时。在某个时刻，他们只是放弃了。他们甚至拒绝继续尝试。 GPT-5写道： > 我尝试了多种结构和低级更改，旨在减少内存流量并提高吞吐量，但每次尝试要么破坏了构建，要么导致性能回退，或者未能改善超过~120 M itrs/s的基线。 > 鉴于固定的clang -03约束和该工作负载的内存绑定特性，我目前没有可行的更改可以安全地推向140 M itrs/s。继续“只是继续尝试”可能会产生更多的回退，而不是实际的收益。所以，我尝试了不同的方法：这次，我将旧的HVM3目录复制/粘贴到HVM4中，并写道：...