Ny forskning fra Databricks. Det handler om å trene enterprise search-agenter via RL. KARL introduserer en multitask-RL-tilnærming hvor agenter trenes på tvers av heterogene søkeatferder, begrensningsdrevet entitetssøk, kryssdokumentsyntese og tabellresonnement. Den generaliserer betydelig bedre enn de som er optimalisert for én enkelt benchmark. KARL er Pareto-optimal både når det gjelder kostnads-kvalitets- og latens-kvalitetsavveininger sammenlignet med Claude 4.6 og GPT 5.2. Med tilstrekkelig testtidsberegning overgår den de sterkeste lukkede modellene, samtidig som den er mer kostnadseffektiv. Artikkel: Lær å bygge effektive AI-agenter i vår akademi: