Nouvelles recherches de Databricks. Il s'agit de former des agents de recherche d'entreprise via le RL. KARL introduit une approche RL multi-tâches où les agents sont formés à travers des comportements de recherche hétérogènes, la recherche d'entités guidée par des contraintes, la synthèse inter-documents et le raisonnement tabulaire. Il se généralise beaucoup mieux que ceux optimisés pour un seul benchmark. KARL est Pareto-optimal à la fois sur les compromis coût-qualité et latence-qualité par rapport à Claude 4.6 et GPT 5.2. Avec un calcul suffisant au moment du test, il dépasse les modèles fermés les plus puissants tout en étant plus rentable. Article : Apprenez à construire des agents IA efficaces dans notre académie :