Penelitian baru dari Databricks. Ini tentang melatih agen pencarian perusahaan melalui RL. KARL memperkenalkan pendekatan RL multi-tugas di mana agen dilatih melintasi perilaku pencarian heterogen, pencarian entitas yang digerakkan oleh kendala, sintesis lintas dokumen, dan penalaran tabel. Ini menggeneralisasi secara substansial lebih baik daripada yang dioptimalkan untuk tolok ukur tunggal mana pun. KARL optimal Pareto pada trade-off kualitas biaya dan kualitas latensi dibandingkan dengan Claude 4.6 dan GPT 5.2. Dengan komputasi waktu pengujian yang memadai, ini melampaui model tertutup terkuat sekaligus lebih hemat biaya. Kertas: Pelajari cara membangun agen AI yang efektif di akademi kami: