J'apprécie l'honnêteté d'@Anthropic dans leur dernière carte système, mais son contenu ne me donne pas confiance que l'entreprise agira de manière responsable avec le déploiement de modèles d'IA avancés : -Ils se sont principalement appuyés sur une enquête interne pour déterminer si Opus 4.6 avait franchi leur seuil de R&D IA autonome-4 (et nécessiterait donc des protections plus strictes pour être publié dans le cadre de leur Politique de Mise à l'Échelle Responsable). Ce n'était même pas une enquête externe d'un tiers impartial, mais plutôt une enquête auprès des employés d'Anthropic. -Lorsque 5/16 des répondants à l'enquête interne ont initialement donné une évaluation suggérant que des protections plus strictes pourraient être nécessaires pour la publication du modèle, Anthropic a suivi spécifiquement avec ces employés et leur a demandé de "clarifier leurs points de vue". Ils ne mentionnent aucun suivi similaire pour les autres 11/16 répondants. Il n'y a aucune discussion dans la carte système sur la façon dont cela pourrait créer un biais dans les résultats de l'enquête. -Leur raison de s'appuyer sur des enquêtes est que leurs évaluations de R&D IA existantes sont saturées. Certains pourraient soutenir que les progrès de l'IA ont été si rapides qu'il est compréhensible qu'ils n'aient pas encore d'évaluations quantitatives plus avancées, mais nous pouvons et devons tenir les laboratoires d'IA à un niveau élevé. De plus, d'autres laboratoires ont des évaluations de R&D IA avancées qui ne sont pas saturées. Par exemple, OpenAI a le benchmark OPQA qui mesure la capacité des modèles d'IA à résoudre de réels problèmes internes rencontrés par les équipes de recherche d'OpenAI et qui ont pris plus d'une journée à résoudre. Je ne pense pas qu'Opus 4.6 soit réellement au niveau d'un chercheur en IA débutant à distance, et je ne pense pas qu'il soit dangereux de le publier. Mais le but d'une Politique de Mise à l'Échelle Responsable est de construire une force institutionnelle et de bonnes habitudes avant que les choses ne deviennent sérieuses. Les enquêtes internes, surtout telles qu'Anthropic les a administrées, ne sont pas un substitut responsable aux évaluations quantitatives.
La carte système @Anthropic est ici :
288