Uutta tutkimusta Databricksilta. Kyse on yrityshakuagenttien kouluttamisesta RL:n kautta. KARL esittelee monitehtäväisen RL-lähestymistavan, jossa agentteja koulutetaan heterogeenisten hakukäyttäytymisten, rajoitepohjaisen entiteettihaun, ristiindokumenttien synteesin ja taulukkopäättelyn kautta. Se yleistää huomattavasti paremmin kuin yksittäistä testiä varten optimoidut. KARL on Pareto-optimaalinen sekä kustannuslaadun että viiveen suhteen verrattuna Claude 4.6:een ja GPT 5.2:een. Riittävällä testiaikalaskennalla se ylittää vahvimmat suljetut mallit ja on samalla kustannustehokkaampi. Artikkeli: Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme: