熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這是本週的儀式研究摘要,一份涵蓋LLM世界和加密與AI交集最新動態的通訊。
每週有數百篇論文發表,跟上最新動態幾乎是不可能的。我們為您閱讀,所以您無需這樣做。

DeepSeekMath-V2:邁向自我驗證的數學推理
本文介紹了 DSMath-V2,這是一個基於 deepseek-3.2-exp 訓練的模型,用於數學中的自然語言證明。生成-驗證差距是非正式證明的一個主要障礙。

他們首先使用專家註釋訓練模型的驗證器,以評估答案的正確性和分析。
這個驗證器用來訓練最終的證明者模型,該模型既撰寫證明又分析其正確性。
他們在2025年國際數學奧林匹克中獲得金牌。
人工智慧集體意識:語言模型的開放性同質性(及其超越)
本文介紹了INFINITY-CHAT,一個包含26K個現實世界查詢的數據集,這些查詢接受多個答案。利用這個數據集,他們研究了70多個語言模型中的內部和外部模型模式崩潰。

他們揭示了一種人工蜂巢效應,具有模型內重複性,即一個模型反覆生成相似的輸出,以及模型間同質性,即不同模型在措辭上略有變化的情況下趨向於相似的想法。這引發了對模型多樣性的質疑。

多代理系統中的潛在協作
這項工作介紹了潛在 MAS,一個在連續潛在空間中運作的端到端協作框架。該設計整合了潛在思維生成和跨代理潛在記憶轉移。

LatentMAS 基於推理表達能力、通信保真度和協作複雜性。在順序和層次 MAS 設置中,Qwen 3(4B、8B 和 14B)超越了基於文本的 MAS 基準,提高了準確性,並減少了輸出標記的使用。

ToolOrchestra:透過高效的模型和工具協同提升智慧
作者提出了一種協同範式,智慧從一個複合系統中產生。一個協同模型以正確的順序調用正確的工具來完成任務。

使用 ToolOrchestra,訓練了一個 8B 模型,利用強化學習來決定何時以及如何調用其他 LMs 和工具。獎勵平衡了正確性、效率和與用戶偏好的對齊。
在 HLE 上,Orchestrator 的表現超越了之前的方法,計算成本卻低得多。

關注我們 @ritualdigest 獲取有關加密貨幣與 AI 研究的更多資訊,並且
@ritualnet 了解 Ritual 正在構建的內容。
3.33K
熱門
排行
收藏
