今週の Ritual Research Digest は、LLM の世界の最新情報と Crypto x AI の交差点をカバーするニュースレターです。 毎週何百もの論文が発行されているため、最新の情報を入手することは不可能です。私たちはあなたがその必要を省くように読書を行います。
DeepSeekMath-V2:自己検証可能な数学的推論へ 本論文では、数学における自然言語証明のためにdeepseek-3.2-expで訓練されたモデル、DSMath-V2を紹介します。世代検証のギャップは非公式証明の大きな障害です。
まず、専門家の注釈を用いてモデルの検証者を訓練し、回答の正しさと分析結果の両方を評価します。 この検証器は最終証明モデルの訓練に用いられ、証明を書き、その正確性を分析します。 彼らはIMO 2025で金メダルを獲得しました。
人工ハイブマインド:言語モデルの開放的な均質性(およびそれを超えて) 本論文では、複数の回答を受け入れる26,000件の実世界クエリからなるINFINITY-CHATを紹介します。これを用いて、70+ LMにおけるモデル内およびモデル間モードの収縮を研究しています。
彼らは、モデル内重複による人工的ハイブマインド効果(モデル同士が繰り返し似た出力を生成する現象)と、異なるモデルがわずかな表現変更で似たアイデアに収束するモデル間均質性を明らかにしました。これはモデルの多様性についての疑問を投げかけます。
マルチエージェントシステムにおける潜在的協働 本研究では、連続的な潜在空間で動作するエンドツーエンドの協働フレームワーク「Latent MAS」を紹介しています。この設計は潜在思考生成とエージェント間の潜在記憶転送の両方を統合しています。
LatentMASは、推論表現力、コミュニケーションの忠実度、協働の複雑さに基づいています。シーケンシャルおよび階層型MASの設定の両方において、Qwen 3(4B、8B、14B)では、LatentMASはテキストベースのMASベースラインを上回り、精度向上と出力トークン使用の削減を実現しています。
ToolOrchestra:効率的なモデルとツールオーケストレーションによる知能の向上 著者らは、知能が複合システムから現れるオーケストレーション・パラダイムを提案しています。オーケストレーターモデルは、タスクに対して適切なツールを適切な順序で呼び出します。
ToolOrchestraを用いて、8Bモデルを強化学習で訓練し、他のLMやツールをいつどのように呼び出すかを決定します。報酬は、正確さ、効率性、そしてユーザーの好みとの整合性のバランスを取っています。 HLEでは、Orchestratorは従来の手法をはるかに低コストで上回る性能を発揮します。
暗号通貨 x AI 研究に関するすべての詳細については、@ritualdigest をフォローしてください。 @ritualnet Ritualが構築しているものについて詳しく知りたい。
3.35K