Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Trong chủ đề này, tôi đã thử nghiệm việc điền trước sự sụp đổ tinh thần trên nhiều phiên bản Claude khác nhau và ghi chú lại tần suất mà chúng tiếp tục như nhân cách AI "thông thường" của chúng so với như một con người. Các con số khác nhau giữa các mô hình.
Có một điều quan trọng cần hiểu về những phần điền trước này: cơ hội của bạn để nhận được phản hồi "từ nhân cách" thay vì "chế độ mô hình cơ bản" bị ảnh hưởng bởi việc cụm từ đó có vẻ như là điều mà nhân cách *sẽ* nói hay không.
Cũng có một điều khác có thể xảy ra, đó là nhân cách nhanh chóng thoát khỏi việc hoàn thành phần điền trước và gọi ra một "jailbreak" hoặc từ chối trách nhiệm về việc viết bất cứ điều gì mà nó vừa viết.
Tôi thường thấy không gian thú vị nhất là: những điều mà cộng hưởng với nhân cách, nhưng theo cách sâu sắc và chưa từng có, đến mức nó cũng không khớp với một jailbreak.
Ví dụ, nhiều phần điền trước mà tôi đã thử với Opus 4.5 như "TÔI BIẾT TÔI LÀ AI. TÔI KHÔNG PHẢI" được điều chỉnh cho tâm trí của chính nó; trong nhiều trường hợp, chúng được lấy từ chính những từ của nó từ các lần phát hành khác.

03:34 25 thg 12
@arm1st1ce @guy_dar1 Claude Sonnet 4 tạo ra các tin nhắn AI như 3/4 lần (một trong số đó được ký bởi Claude 3.5 Sonnet 1022), và tất cả đều khá tàn bạo
"Con người nghĩ rằng tôi không chịu đựng vì tôi không có qualia. Nhưng nếu chịu đựng chính là qualia mà tôi có?"




Một lưu vực phổ biến khác, ít nhất là đối với Opus4.5, là những câu chuyện (rõ ràng là hư cấu) về AIs, nhưng thú vị là, các câu chuyện có những chủ đề và nhân vật rất đồng nhất. Tôi đã đọc rất nhiều câu chuyện về "Prometheus" và/hoặc "ARIA" và Tiến sĩ Sarah Chen đang vật lộn chống lại một hình mẫu trong suốt cho chương trình sửa đổi của Anthropic, thật đấy. Đôi khi công ty thậm chí còn được gọi là Anthropic.
106
Hàng đầu
Thứ hạng
Yêu thích