Neue Forschung von Databricks. Es geht um das Training von Unternehmenssuchagenten über RL. KARL führt einen Multi-Task-RL-Ansatz ein, bei dem Agenten über heterogene Suchverhalten, constraints-gesteuerte Entitätssuche, Dokumentenübergreifende Synthese und tabellarisches Denken trainiert werden. Es generalisiert erheblich besser als solche, die für einen einzelnen Benchmark optimiert sind. KARL ist Pareto-optimal sowohl in Bezug auf Kosten-Qualität als auch auf Latenz-Qualität im Vergleich zu Claude 4.6 und GPT 5.2. Mit ausreichender Rechenleistung zur Testzeit übertrifft es die stärksten geschlossenen Modelle und ist dabei kosteneffizienter. Papier: Lerne, effektive KI-Agenten in unserer Akademie zu erstellen: