Không hiểu về sự gia tăng theo cấp số nhân, một lần nữa? Cuộc trò chuyện của tôi với @Mononofu - Julian Schrittwieser (@AnthropicAI, AlphaGo Zero, MuZero) - về nước đi 37, mở rộng RL, Giải Nobel cho AI, và biên giới AI: 00:00 - Mở đầu lạnh: “Chúng ta không thấy bất kỳ sự chậm lại nào.” 00:32 - Giới thiệu — Gặp Julian 01:09 - “Sự gia tăng theo cấp số nhân” từ bên trong các phòng thí nghiệm biên giới 04:46 - 2026–2027: các tác nhân làm việc cả ngày; độ rộng chuyên gia 08:58 - Các tiêu chuẩn so với thực tế: công việc dài hạn, GDP-Val, giá trị người dùng 10:26 - Nước đi 37 — điều gì thực sự đã xảy ra và tại sao nó quan trọng 13:55 - Khoa học mới: AlphaCode/AlphaTensor → khi nào AI kiếm được Giải Nobel? 16:25 - Sự gián đoạn so với tiến bộ mượt mà (và các dấu hiệu cảnh báo) 19:08 - Liệu việc tiền huấn luyện + RL có đưa chúng ta đến đó không? (bỏ qua các cuộc tranh luận AGI) 20:55 - “RL từ đầu” của Sutton? Quan điểm của Julian 23:03 - Con đường của Julian: Google → DeepMind → Anthropic 26:45 - AlphaGo (học + tìm kiếm) bằng tiếng Anh đơn giản 30:16 - AlphaGo Zero (không có dữ liệu con người) ...