cách tiếp cận "model-first" của openai khi nói đến các tác nhân, với các dây đai rất mỏng và hầu hết công việc được điều khiển bởi chính mô hình (so với cách tiếp cận của Claude có sự tích hợp chặt chẽ hơn giữa mô hình<>dây đai) thật sự thú vị vì nó chắc chắn mang lại trải nghiệm người dùng kém hơn, nó "cảm thấy" không tốt bằng vì khó để biết các tác nhân sẽ thực sự làm gì, nó cũng "cảm thấy" kém thông minh hơn vào những lúc, nhưng kết quả thì hoàn toàn tương đương giữa 5.2-codex-xhigh và opus 4.5 (với mô hình openai thường tốt hơn ở những thứ kỹ thuật, phức tạp và chính xác hơn vào những lúc theo ý kiến của tôi)
Tôi nghĩ rằng OpenAI sẽ được hưởng lợi từ việc có những dự án ra mắt (mà không cần thông cáo báo chí lớn), thử nghiệm những điều mới mẻ và táo bạo xung quanh các mô hình điên rồ của họ, và xem cái gì hiệu quả và mọi người phản ứng như thế nào - có rất nhiều điều hiển nhiên để làm trên claude code / opencode / amp mà rất thú vị và có thể tăng gấp 10 lần vì bạn thực sự sở hữu mô hình + bạn đang phục vụ nó.
635