我正在处理一个非常棘手的问题的模型评审,唉: opus 在尝试很多事情时消耗了大量代币,但最终没有解决问题。 codex:每5步就问我想做什么,最终什么也没做。 gemini 3 pro:导致 VS Code 崩溃,造成无限循环。 最终 opus 仍然是王者,只是问题太糟糕了。
公平地说,opus确实试着告诉我3-4次我不应该做这个问题,因为它太难太复杂了
285