一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX | OKX Wallet

熱門話題

這是本週的儀式研究摘要，一份涵蓋LLM世界和加密與AI交集最新動態的通訊。每週有數百篇論文發表，跟上最新動態幾乎是不可能的。我們為您閱讀，所以您無需這樣做。

DeepSeekMath-V2：邁向自我驗證的數學推理本文介紹了 DSMath-V2，這是一個基於 deepseek-3.2-exp 訓練的模型，用於數學中的自然語言證明。生成-驗證差距是非正式證明的一個主要障礙。

他們首先使用專家註釋訓練模型的驗證器，以評估答案的正確性和分析。這個驗證器用來訓練最終的證明者模型，該模型既撰寫證明又分析其正確性。他們在2025年國際數學奧林匹克中獲得金牌。

人工智慧集體意識：語言模型的開放性同質性（及其超越）本文介紹了INFINITY-CHAT，一個包含26K個現實世界查詢的數據集，這些查詢接受多個答案。利用這個數據集，他們研究了70多個語言模型中的內部和外部模型模式崩潰。

他們揭示了一種人工蜂巢效應，具有模型內重複性，即一個模型反覆生成相似的輸出，以及模型間同質性，即不同模型在措辭上略有變化的情況下趨向於相似的想法。這引發了對模型多樣性的質疑。

多代理系統中的潛在協作這項工作介紹了潛在 MAS，一個在連續潛在空間中運作的端到端協作框架。該設計整合了潛在思維生成和跨代理潛在記憶轉移。

LatentMAS 基於推理表達能力、通信保真度和協作複雜性。在順序和層次 MAS 設置中，Qwen 3（4B、8B 和 14B）超越了基於文本的 MAS 基準，提高了準確性，並減少了輸出標記的使用。

ToolOrchestra：透過高效的模型和工具協同提升智慧作者提出了一種協同範式，智慧從一個複合系統中產生。一個協同模型以正確的順序調用正確的工具來完成任務。

使用 ToolOrchestra，訓練了一個 8B 模型，利用強化學習來決定何時以及如何調用其他 LMs 和工具。獎勵平衡了正確性、效率和與用戶偏好的對齊。在 HLE 上，Orchestrator 的表現超越了之前的方法，計算成本卻低得多。

關注我們 @ritualdigest 獲取有關加密貨幣與 AI 研究的更多資訊，並且 @ritualnet 了解 Ritual 正在構建的內容。

3.33K

熱門

排行

收藏