Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Đây là bản Digest Nghiên cứu Ritual của tuần này, một bản tin bao quát những điều mới nhất trong thế giới LLM và giao thoa giữa Crypto x AI. Với hàng trăm tài liệu được công bố hàng tuần, việc cập nhật những điều mới nhất là điều không thể. Chúng tôi làm việc đọc để bạn không phải làm.

DeepSeekMath-V2: Hướng tới Lập luận Toán học Tự xác minh Bài báo này giới thiệu DSMath-V2, một mô hình được đào tạo trên deepseek-3.2-exp cho việc chứng minh ngôn ngữ tự nhiên trong toán học. Khoảng cách giữa tạo ra và xác minh là một rào cản lớn cho việc chứng minh không chính thức.

Họ đầu tiên đào tạo một người xác minh cho mô hình bằng cách sử dụng các chú thích của chuyên gia để đánh giá cả độ chính xác của các câu trả lời và phân tích. Người xác minh này được sử dụng để đào tạo mô hình chứng minh cuối cùng, mô hình này vừa viết chứng minh vừa phân tích độ chính xác của chúng. Họ đạt huy chương vàng tại IMO 2025.

Trí tuệ nhân tạo Hivemind: Tính đồng nhất mở của các mô hình ngôn ngữ (và hơn thế nữa) Bài báo giới thiệu INFINITY-CHAT, một tập dữ liệu gồm 26K truy vấn từ thế giới thực chấp nhận nhiều câu trả lời. Sử dụng điều này, họ nghiên cứu sự sụp đổ chế độ trong và giữa các mô hình trong hơn 70 mô hình ngôn ngữ.

Họ phát hiện ra hiệu ứng Tập thể Nhân tạo với sự lặp lại trong mô hình, nơi một mô hình liên tục tạo ra các đầu ra tương tự, và sự đồng nhất giữa các mô hình, nơi các mô hình khác nhau hội tụ vào những ý tưởng tương tự với những thay đổi nhỏ về cách diễn đạt. Điều này đặt ra câu hỏi về sự đa dạng của các mô hình.

Hợp tác tiềm ẩn trong Hệ thống Đa tác nhân Công việc này giới thiệu Latent MAS, một khung hợp tác từ đầu đến cuối hoạt động trong không gian tiềm ẩn liên tục. Thiết kế tích hợp cả việc tạo ra suy nghĩ tiềm ẩn và chuyển giao bộ nhớ tiềm ẩn giữa các tác nhân.

LatentMAS dựa trên khả năng biểu đạt lý luận, độ trung thực trong giao tiếp và độ phức tạp trong hợp tác. Trong cả hai bối cảnh MAS tuần tự và phân cấp, Qwen 3(4B, 8B, và 14B), LatentMAS vượt trội hơn so với các tiêu chuẩn MAS dựa trên văn bản, cải thiện độ chính xác và giảm thiểu việc sử dụng token đầu ra.

ToolOrchestra: Nâng cao trí tuệ thông qua việc phối hợp mô hình và công cụ hiệu quả Các tác giả đề xuất một mô hình phối hợp nơi trí tuệ xuất hiện từ một hệ thống tổng hợp. Một mô hình điều phối gọi các công cụ phù hợp theo đúng thứ tự cho một nhiệm vụ.

Sử dụng ToolOrchestra, một mô hình 8B được huấn luyện bằng RL để quyết định khi nào và cách nào để gọi các LMs và công cụ khác. Các phần thưởng cân bằng độ chính xác, hiệu quả và sự phù hợp với sở thích của người dùng. Trên HLE, Orchestrator vượt trội hơn các phương pháp trước đó với chi phí tính toán thấp hơn nhiều.

Theo dõi chúng tôi @ritualdigest để biết thêm về tất cả các vấn đề liên quan đến nghiên cứu crypto x AI, và @ritualnet để tìm hiểu thêm về những gì Ritual đang xây dựng.

3,35K

Hàng đầu

Thứ hạng

Yêu thích