15T est le même budget que le pré-entraînement initial de kimi k2, à ma connaissance c'est la première fois qu'une équipe utilise ouvertement un point de contrôle précédent pour construire un modèle encore plus puissant. Nous allons continuer à voir de plus en plus de cette intervention "en cours d'entraînement" pour changer l'architecture, les modalités, un meilleur contexte long, de meilleures données agentiques... C'est très excitant et cela permet à d'autres entreprises de rejoindre la course (curseur ?) grâce à des fournisseurs comme kimi (et d'autres comme deepseek, meituan, zai,...) qui publient le modèle de base.