Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Getalenteerde mensen worden gepromoveerd naar management. Dat geldt ook voor getalenteerde modellen. Claude beheert code-uitvoering. Gemini routeert verzoeken via CRM en chat. GPT-5 kan openbaar aandelenonderzoek coördineren.
Waarom nu? De nauwkeurigheid van het aanroepen van tools heeft een drempel overschreden. Twee jaar geleden slaagde GPT-4 in minder dan 50% van de taken voor het aanroepen van functies. Modellen hallucineerden parameters, noemden verkeerde eindpunten, vergaten context halverwege het gesprek. Vandaag de dag overschrijden SOTA-modellen 90% nauwkeurigheid op benchmarks voor het aanroepen van functies. De prestaties van de meest recente modellen, zoals Gemini 3, zijn in de praktijk aanzienlijk beter dan de benchmarks suggereren.

Hadden we triljoen-parameter modellen nodig alleen om functieaanroepen te doen? Verrassend genoeg, ja.
Experimenten met kleine actiemodellen, lichte netwerken die alleen zijn getraind voor toolselectie, falen in productie. Ze missen wereldkennis. Beheer, zo blijkt, vereist context.
Tegenwoordig spawn de orkestrator zichzelf vaak als een subagent (Claude Code start een andere Claude Code op). Deze symmetrie zal niet blijven bestaan.
De bittere les benadrukt dat steeds grotere modellen alles zouden moeten afhandelen. Maar de economie duwt terug: distillatie en versterkende fine-tuning produceren modellen die 40% kleiner en 60% sneller zijn, terwijl ze 97% van de prestaties behouden.
Gespecialiseerde agenten van verschillende leveranciers komen op. Het grensmodel wordt de uitvoerende, die verzoeken doorverwijst naar specialisten. Deze specialisten kunnen derde partijen zijn, die allemaal strijden om de beste in hun domein te zijn.

63
Boven
Positie
Favorieten
