Nieuw onderzoek van Databricks. Het gaat over het trainen van enterprise zoekagenten via RL. KARL introduceert een multi-task RL-aanpak waarbij agenten worden getraind op heterogene zoekgedragingen, constraint-gedreven entiteitszoekopdrachten, cross-document synthese en tabulaire redenering. Het generaliseert aanzienlijk beter dan die geoptimaliseerd zijn voor een enkele benchmark. KARL is Pareto-optimaal op zowel kosten-kwaliteit als latentie-kwaliteit afwegingen vergeleken met Claude 4.6 en GPT 5.2. Met voldoende rekentijd tijdens de test, overtreft het de sterkste gesloten modellen terwijl het kostenefficiënter is. Paper: Leer effectieve AI-agenten te bouwen in onze academie: