Nowe badania z Databricks. Dotyczą one szkolenia agentów wyszukiwania w przedsiębiorstwie za pomocą RL. KARL wprowadza podejście RL wielozadaniowego, w którym agenci są szkoleni w różnych zachowaniach wyszukiwania, wyszukiwaniu jednostek z ograniczeniami, syntezie międzydokumentowej oraz rozumowaniu tabelarycznym. Generalizuje znacznie lepiej niż te zoptymalizowane pod kątem pojedynczego benchmarku. KARL jest Pareto-optymalny zarówno w zakresie kosztów-jakości, jak i opóźnienia-jakości w porównaniu do Claude 4.6 i GPT 5.2. Przy wystarczającej mocy obliczeniowej w czasie testu, przewyższa najsilniejsze modele zamknięte, jednocześnie będąc bardziej efektywnym kosztowo. Artykuł: Naucz się budować skuteczne agenty AI w naszej akademii: