Le Sonnet 4.5 vient d'être publié – il occupe la première place de nos benchmarks en finance et en programmation ! Nous avons eu la chance de tester le nouveau modèle @claudeai avant son lancement et nous l'avons trouvé exceptionnellement capable, en particulier pour les applications agentiques.
(1/6)
GPT-5 Codex a obtenu des performances impressionnantes dans presque tous les benchmarks que nous avons évalués ! Le plus notable est son amélioration de 10 % dans le Terminal-Bench par rapport au précédent #1, GPT-5. Félicitations à l'équipe @OpenAI pour ce modèle de codage solide !
(1/6)