Được rồi, tôi nghĩ thí nghiệm để AI làm việc 24/7 của tôi kết thúc ở đây. Nó không hiệu quả. Mã nguồn trở nên phức tạp, kết quả không tốt lắm, AI không thể vượt qua những bức tường khó khăn (nó vẫn hoàn toàn không thể *hiểu* SupGen), và chi phí thì cực kỳ đắt đỏ (đã tiêu tốn khoảng 1k trong 2 ngày qua). Kết quả tốt nhất là trên trình biên dịch JS, chủ yếu vì nó quen thuộc (so với inets), nhưng không đáng để mất kiểm soát đối với mã nguồn. Tôi nghĩ giấc mơ có AI làm việc ở nền tảng và tạo ra tiến bộ thực sự trong những thứ quan trọng (tức là, những thứ thực sự mới mẻ) vẫn chưa đến. Nó vẫn là một cỗ máy bị kẹt cứng vào dữ liệu huấn luyện của chính nó, không thể suy nghĩ ngoài khuôn khổ. Nó rất tuyệt để xây dựng những thứ đã được xây dựng. Nhưng không phải những thứ mới. Ngoài ra, việc lập trình bình thường có lợi thế không được đánh giá cao là bạn đang làm hai việc cùng một lúc: xây dựng một mã nguồn *và* học nó. AI chỉ làm được một nửa trong số đó. Nửa còn lại thì rõ ràng là không thể 🤔
hoặc có thể tôi chỉ không thể chịu đựng việc trả lời những câu hỏi ngớ ngẩn thật sự, GPT-5.3 *không thể giao tiếp*. nó viết rất nhiều thứ, và sau đó hỏi BẠN những câu hỏi về mã của nó. như thể bạn đã viết nó. giả định rằng bạn biết nó đang nói về cái gì nó không có mô hình tư duy về những gì đang diễn ra
hoặc có thể tôi chỉ không thể chịu đựng việc trả lời những câu hỏi ngớ ngẩn thật sự, GPT-5.3 *không thể giao tiếp*. nó viết rất nhiều thứ, và sau đó hỏi BẠN những câu hỏi về mã của nó. như thể bạn đã viết nó. giả định rằng bạn biết nó đang nói về cái gì nó hoàn toàn không có lý thuyết về tâm trí.
Tôi nhớ sonnet 3.5 khi AI chỉ là một công cụ tự động hoàn thành được tôn vinh. Có lẽ tôi nên cho opus 4.6 một cơ hội lớn hơn. Chắc chắn nó mắc nhiều lỗi logic hơn gpt 5.3, nhưng mọi thứ khác về nó thì dễ chịu hơn rất nhiều. Và nếu tôi đã phải giải thích tất cả logic thì... tại sao không?
Tôi nhớ sonnet 3.5 khi AI chỉ là một công cụ hoàn thiện tự động được ca ngợi. Có lẽ tôi nên cho opus 4.6 một cơ hội lớn hơn. Chắc chắn nó mắc nhiều lỗi logic hơn gpt 5.3, nhưng mọi thứ khác về nó thì dễ chịu hơn rất nhiều. Và nếu tôi đã phải giải thích tất cả logic... thì tại sao không?
Sáng nay: "Bend→JS bot hoàn toàn bị kẹt. Đại lý đã cạn kiệt những chiến thắng dễ dàng và giờ đang cố gắng thực hiện những tối ưu hóa vi mô ngày càng tuyệt vọng mà tất cả đều thất bại. Các chỉ số hiệu suất không thay đổi kể từ khi những chiến thắng ban đầu xuất hiện khoảng 50 vòng trước." Các bot khác cũng gặp số phận tương tự ):
Sáng nay: "Bend→JS bot đã hoàn toàn bị kẹt. Đại lý đã cạn kiệt những chiến thắng dễ dàng và giờ đang cố gắng thực hiện những tối ưu hóa vi mô ngày càng tuyệt vọng mà tất cả đều thất bại, trong khi đặt câu hỏi về nội bộ V8. Các chỉ số benchmark không hề thay đổi kể từ ~50 vòng trước." thở dài
84