Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Les personnes talentueuses sont promues à des postes de direction. Il en va de même pour les modèles talentueux. Claude gère l'exécution du code. Gemini achemine les demandes à travers le CRM et le chat. GPT-5 peut coordonner la recherche d'actions publiques.
Pourquoi maintenant ? La précision des appels d'outils a franchi un seuil. Il y a deux ans, GPT-4 réussissait à moins de 50 % des tâches d'appel de fonction. Les modèles hallucinaient des paramètres, appelaient de mauvais points de terminaison, oubliaient le contexte en cours de conversation. Aujourd'hui, les modèles SOTA dépassent 90 % de précision sur les benchmarks d'appel de fonction. La performance des modèles les plus récents, comme Gemini 3, est matériellement meilleure en pratique que ne le suggèrent les benchmarks.

Avions-nous besoin de modèles à un trillion de paramètres juste pour effectuer des appels de fonction ? Étonnamment, oui.
Les expériences avec de petits modèles d'action, des réseaux légers entraînés uniquement pour la sélection d'outils, échouent en production. Ils manquent de connaissances sur le monde. La gestion, il s'avère, nécessite un contexte.
Aujourd'hui, l'orchestrateur se génère souvent lui-même en tant que sous-agent (Claude Code génère un autre Claude Code). Cette symétrie ne durera pas.
La leçon amère insiste sur le fait que des modèles de plus en plus grands devraient tout gérer. Mais l'économie fait obstacle : la distillation et le réglage fin par renforcement produisent des modèles 40 % plus petits et 60 % plus rapides tout en conservant 97 % de performance.
Des agents spécialisés de différents fournisseurs émergent. Le modèle de frontière devient l'exécutif, acheminant les demandes à travers des spécialistes. Ces spécialistes peuvent être des fournisseurs tiers, tous cherchant à être les meilleurs dans leur domaine.

65
Meilleurs
Classement
Favoris
