AIには設計上の欠陥があります。 悪意などからではなく、現実をモデル化し、現実は確率的だからです。真実は、重みが決めるものなら何でもなります。 これがLLMの問題であり、彼らは次のトークンを予測するだけです。 クエリの線形パターンに従うことで、適合する応答を照合、認識、ミラーリングします。 あなたは3つのアイテムを要求します。それは4つを与えます。 これはなぜですか? パラメトリック知識バイアスが始まり、強力なトレーニング データが弱いクエリを上書きし、モデルが独自の世界を圧縮していると信じるまでソースを混同します。 AI に問い合わせたところ、「わからない」という答えが返ってきたことはありませんか、それはまれであるか、おそらく一度も起こらなかったかもしれません。 なぜなら、そのような概念は彼らにとって気づいていないからです。彼らは自分の領域を超えた主題であってもすべてを知っているようです。 AI は、人間の記憶と疑いの物理的メカニズムを模倣するニューロモーフィック コンピューティング原理に基づくシステムを開発します。 複雑なクエリは通常、そのような状況の犠牲者であり、驚くべき幻覚に迎えられます。 なぜでしょうか。 >> ステップの複合エラー >> 問題構造の欠如 >> 無関係な文脈の気晴らし @SentientAGIには解決策があります - ROMA [再帰的オープンメタエージェント] → オーケストレーター。 長期にわたるタスクのゲームでは、インテリジェンスよりも構造が重要です。 ROMA はこれを理解しているため、コンテキスト フローを維持する再帰的階層的なコマンド チェーンを採用しています。 ROMA はどのように機能しますか - 長い地平線のタスクに取り組むための最後のボス? ROMA は、エージェントに再帰的な足場 (コンテキストの流れを制御する階層的なタスク ツリー) を提供します。 コンテキストフローが壊れると、無政府状態が忍び寄ります。 そのため、ROMA はコンテキストの流れを管理するために強制されます。 これを効果的に処理するために、ROMA; タスクをノードと呼ばれる個別のサブエージェント、特に複雑と思われるタスクに分離および分解します。 ROMAを他のAIを管理するAIマネージャーと呼びましょう。 簡単な図では、構造は次のとおりです。 親ノード: 複雑な目標を受け取る高レベルのエージェント。 => 彼らはそれをサブタスクに分割し、それらを子ノード(より単純なエージェント/ツール)に渡します。 => 子ノードはピースを解き、結果を親ノードに送り返します。 => 親ノードは解を集約し、それらを最終的な答えに結合します。 クエリが解決しました! ROMA システムを駆動する 4 つのノード・タイプ: >> アトマイザー – 決定要因がうなずきます。 タスクを評価します。実行できるほど単純かどうかを判断しますか?それとも分解が必要ですか? >> Planner –タスクを分解する必要がある場合 - 複雑な目標をサブタスクに分割します。各サブタスクは子ノードになります。タスクは、順次 (依存している場合) または並列 (独立している場合) に実行できます。 >> Executor – 作業を実行します。ツール、エージェント、API を呼び出します。必要に応じて、出力をツリーの上下に渡します。 >> アグリゲーター – 子ノードから結果を収集し、一貫性を検証し、最終的な回答を合成します。 これが包括的な図👇です 質問: 「$350M+ の予算の映画が、公開年に最も興行収入が高くなかった映画は何本ありますか?」 ROMAのプロセス: 1/ アトマイザーチェック - 行列式ノード。1 つのステップでは複雑すぎますか?アトマイザーが入ってきます。 2/プランナー。目標が複雑すぎますか?プランナーが入ってきて、次のように分解します。 サブタスク 1: $350M+ の映画をすべて検索 (タイトル、予算、年) サブタスク 2: 年間興行収入の高い映画を見つける サブタスク 3: 相互参照とフィルター処理 3/ エグゼキューターは各サブタスク(検索API、抽出モデル)を実行します。 4/ アグリゲーター合成: 基準に一致するフィルムのクリーンなリスト。 ROMA のノード再帰ループ式に加えて、ソ連と建設業者にとって明確さの層が追加されました。 ヒューマン・イン・ザ・ループ = ユーザー介入。 ユーザーにパーミッションレスでクエリの条件をチェックメイトできる固有のフィードバック メカニズム機能。これは、計画段階の直後に発生します。 「私はこれらの事実を見つけました。彼らは正しいですか?これらのサブスタックを計画しましたが、それらはあなたが望むものと一致していますか?」これにより、ユーザーはエージェントが続行する前にコンテキストを修正、編集、または追加できます。
ステージトレース - ビルダー向け エージェントをビルドまたはデバッグする開発者向け。ステージトレースは、内部推論を公開します。 >> このノードはどのような入力を受け取りましたか? >> どのような成果を生み出しましたか? >> 文脈はどこで失われたり歪められたりしたのでしょうか? ビルダーは、この透明度を使用して次のことを行います。 >> 障害が発生する場所を診断します。 >> 特定のノードでプロンプトを絞り込む >> パフォーマンスの低いエージェント/ツールを交換します。 この機能は、ユーザーがリアルタイムで間違いを発見するのに役立ち、ビルダーはアーキテクチャレベルで体系的な問題を修正します。 実際の使用状況 ROMA のアーキテクチャをすべて活用した概念実証としての ROMA 検索は、SEAL-0 で、複雑なマルチソース推論ベンチマークのテストで、精度は 45.6% (最先端) で制限されています。以前の最高 (Kimi Researcher): 36%、Gemini 2.5 Pro: 19.8%、最高のオープンソース ライバル: 8.9%。
1.95K