Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚀 Báo cáo Kỹ thuật LongCat-Flash-Thinking-2601 – Đã được phát hành hoàn toàn!
Những điểm chính:
🌍 Học tăng cường agentic quy mô lớn (14 trang phân tích sâu!)
🔹 Mở rộng môi trường: Một cái nhìn chi tiết về quy trình tự động của chúng tôi xây dựng hơn 10,000 môi trường có thể thực thi và xác minh trên hơn 20 lĩnh vực.
🔹 Hạ tầng RL: Một khung DORA được nâng cấp hỗ trợ đào tạo bất đồng bộ với hơn 32,000 môi trường đồng thời, giải quyết các vấn đề ổn định trong các nhiệm vụ dài hạn và rất đa dạng.
🛡️ Độ bền trong thực tế
🔹 Tiêm nhiễm tiếng ồn: Không còn các agent "nhà kính" nữa. Chúng tôi phân tích có hệ thống tiếng ồn trong thế giới thực (tiếng ồn từ người dùng/công cụ) và tiêm nhiễm trực tiếp vào vòng lặp đào tạo.
🔹 RL theo chương trình: Một chiến lược dựa trên chương trình mà dần dần làm cho mô hình trở nên mạnh mẽ hơn trước các môi trường lộn xộn, không hoàn hảo.
🧠 Khung tư duy nặng
🔹 Lập luận song song: Mở rộng chiều rộng bằng cách tạo ra nhiều quỹ đạo lập luận độc lập.
🔹 Tóm tắt lặp lại: Mở rộng chiều sâu bằng cách sử dụng một mô hình tóm tắt để phản ánh và tổng hợp các quỹ đạo song song trước khi đưa ra quyết định cuối cùng.
🔹 Bộ nhớ ngữ cảnh: Một mô-đun bộ nhớ được thiết kế đặc biệt để giữ cho lập luận nhất quán qua các khoảng thời gian dài.
⚡ Sự chú ý Zigzag
🔹 Thiết kế Kết nối Zigzag kết hợp MLA + SSA để giảm tính toán trong khi vẫn bảo tồn dòng thông tin toàn cầu.
🔹 Chuyển đổi giữa chừng sang các biến thể thưa thớt mang lại tốc độ tăng 1.5× và hỗ trợ ngữ cảnh 1 triệu token — đặt nền tảng cho những đột phá trong tư duy agentic dài hạn.
🔹 Khám phá:
📊 Đạt SOTA trong số
các mô hình mã nguồn mở trên các tiêu chuẩn agentic chính: tìm kiếm, sử dụng công cụ, lập luận toán học và lập trình.
Nếu bạn muốn biết thêm chi tiết, hãy thoải mái kiểm tra báo cáo kỹ thuật đầy đủ.




Hàng đầu
Thứ hạng
Yêu thích
