Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Personne ne sait ce qui s'en vient
Une seule personne avec une idée pourrait agir en tant que "CEO" d'une entreprise de 10 000 agents dans 2 ans.
Vous aurez "le logiciel comme une pensée" et non comme un service. Lorsque vous parlez, un milliard d'instances "essaim" construit l'infrastructure backend, frontend, sécurité et mise à l'échelle en quelques minutes.
Les 18 derniers mois ont vu le rythme de progrès le plus rapide que nous ayons jamais connu dans l'histoire de l'informatique.
Je vous implore de lire sur SWE pro. Il a été conçu pour être résistant à la contamination. Je n'ai pas encore lu de bonne raison pour laquelle, une fois que nous atteignons 90-100 % sur cette référence, toute l'ingénierie logicielle ne serait pas résolue. C'est l'une des références les plus complexes et difficilement conçues. Les tâches sont si longues que l'agent doit être capable d'apprendre de ses propres échecs de tests au cours de la même session - essentiellement, un modèle devrait avoir une forme d'apprentissage continu pour battre cette référence.
L'aperçu de Gemini 2.5 a obtenu 13 %
L'aperçu de Gemini 3 a obtenu 43 %
Claude Opus 4.5 est actuellement en tête avec 45 % (selon scale ai) — VOUS AVEZ DES PERSONNES CHEZ ANTHROPIC QUI VOUS DISENT QU'ILS REGARDENT CLAUDE TOUTE LA JOURNÉE ET COMBLENT LES ÉCARTS.
Bien sûr, vous pouvez crier au loup qu'ils sont incités à le dire, mais votre chronologie X n'a-t-elle pas été, ces 2 dernières semaines, un choc constant sur la qualité des modèles de codage ? Surtout 4.5 Opus ?
Il est clairement évident pour moi que l'ingénierie logicielle sera résolue dans 2 ans. Même si vous deviez doubler, non TRIPLER cette estimation, cela aurait un IMPACT PROFOND sur le PIB et la vie moyenne des Américains.

Meilleurs
Classement
Favoris
