Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ny forskning fra Databricks.
Det handler om å trene enterprise search-agenter via RL.
KARL introduserer en multitask-RL-tilnærming hvor agenter trenes på tvers av heterogene søkeatferder, begrensningsdrevet entitetssøk, kryssdokumentsyntese og tabellresonnement.
Den generaliserer betydelig bedre enn de som er optimalisert for én enkelt benchmark.
KARL er Pareto-optimal både når det gjelder kostnads-kvalitets- og latens-kvalitetsavveininger sammenlignet med Claude 4.6 og GPT 5.2.
Med tilstrekkelig testtidsberegning overgår den de sterkeste lukkede modellene, samtidig som den er mer kostnadseffektiv.
Artikkel:
Lær å bygge effektive AI-agenter i vår akademi:

Topp
Rangering
Favoritter
