Databricksによる新しい研究。 これは、エンタープライズ検索エージェントをRLでトレーニングすることに関するものです。 KARLは、エージェントが異種検索行動、制約駆動型エンティティ検索、文書間合成、表形式推論を横断して訓練されるマルチタスク強化学習アプローチを導入します。 単一のベンチマークに最適化されたものよりもはるかに一般化が優れています。 KARLはコスト・品質・レイテンシー品質のトレードオフにおいて、Claude 4.6やGPT 5.2と比較してパレート最適です。 十分なテスト時間計算があれば、最強のクローズドモデルを上回り、コスト効率も高まります。 論文: 私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう: