バンガー研究論文。 🚨 LLMは反論が苦手です。この論文はその理由を正確に示しています。 ほとんどのAIツールは反論を執筆作業のように扱います。丁寧なテキストを作成してください。自信を持って聞こえてください。前に進んでください。 だからこそ、彼らはトップクラスのカンファレンスで失敗するのです。 この研究は反論問題全体を覆す。 「回答を生成する」のではなく、反論を意思決定+証拠の整理タスクとして扱います。 RebuttalAgentと呼ばれるこのシステムは、ロジックが完璧になるまで何も書き込まないマルチエージェントパイプラインです。 まず、レビュアーのフィードバックを原子化します。曖昧な段落はすべて、具体的で実行可能な懸念事項に分割されます。ポイントを逃すことはありません。無関係な批評をまとめてまとめるのは避けましょう。補償は他の何よりも先に実施されます。 次に本当の革新が訪れます:証拠優先の推論です。 各懸念に対して、システムはハイブリッドなコンテキストを構築します。論文の大部分はトークン節約のために圧縮されたままですが、そのレビュアーコメントに関連する正確なセクションは完全な忠実度で拡張されています。内部証拠だけでは不十分な場合、オンデマンドの検索エージェントが外部の書類を取得し、引用可能なブリーフに変換します。追跡可能でなければ何も引用されません。 そして、多くのLLMツールが完全に省略するステップ、戦略検証が訪れます。 作成前に、RebuttalAgentは明示的な対応計画を作成します。それは以下の通りに分けられます: 既存の結果から明確にできる点 本当に新しい実験が必要なもの 過剰にコミットせずに認めるべきこと チェッカーエージェントは、この計画の論理的一貫性とコミットメントの安全性を監査します。もし回答が存在しない結果を示唆しているなら、ブロックされます。幻覚はここで消えます。...