đánh giá mô hình cho một vấn đề rất khó mà tôi đang làm việc, thở dài: opus tiêu tốn rất nhiều token khi thử nhiều thứ nhưng cuối cùng không giải quyết được vấn đề codex: hỏi tôi muốn làm gì mỗi 5 bước và cuối cùng không làm gì cả gemini 3 pro: làm treo vs code gây ra vòng lặp vô hạn cuối cùng opus vẫn là vua, chỉ có điều vấn đề thật tệ.
Để công bằng mà nói, opus đã cố gắng nói với tôi 3-4 lần rằng tôi không nên làm bài toán này và rằng nó quá khó và phức tạp.
271