Epiplexity, Lý luận & Hành vi "Người ngoài hành tinh" của LLMs: cuộc trò chuyện của tôi với @Pavel_Izmailov, nhà nghiên cứu AI tại @AnthropicAI và giáo sư tại @nyuniversity. 00:00 - Giới thiệu 00:53 - Bản năng sinh tồn của người ngoài hành tinh: liệu việc học liên tục có sắp tạo ra một vấn đề lớn về sự đồng bộ không? Phân tích bài viết của @iruletheworldmo 03:33 - Liệu AI có học được sự lừa dối từ văn học khoa học viễn tưởng không? 05:55 - Định nghĩa Sự đồng bộ, Siêu đồng bộ & các đội ngũ OpenAI 08:12 - Hành trình của Pavel: Từ toán học Nga đến Siêu đồng bộ OpenAI 10:46 - Kiểm tra văn hóa: OpenAI vs. Anthropic vs. Học viện 11:54 - Tại sao chuyển đến NYU? Học viện và nhu cầu nghiên cứu khám phá 13:09 - Liệu lý luận có làm cho sự đồng bộ AI khó khăn hơn hay dễ hơn? 14:22 - Sandbagging: Khi các mô hình giả vờ ngu ngốc 16:19 - Giám sát có thể mở rộng: Sử dụng AI để giám sát AI 18:04 - Tổng quát từ Yếu đến Mạnh 22:43 - Giải thích cơ chế: Bên trong chiếc hộp đen 25:08 - Cuộc bùng nổ lý luận 27:07 - Liệu Transformers có đủ hay chúng ta cần một mô hình mới?...