Composer 2 n'est rien d'autre que Kimi K2.5 avec apprentissage par renforcement. Quelqu'un a sniffé les appels API. L'ID du modèle est "kimi-k2p5-rl-0317-s515-fast" hébergé sous le compte d'Anysphere. Cursor ne forme pas son propre modèle depuis zéro. Ils affinent Kimi K2.5 avec RL et l'appellent Composer 2. Ce billet de blog disait "notre première course de préentraînement continu." C'est un préentraînement continu sur le modèle de quelqu'un d'autre. Maintenant, les problèmes d'hallucination ont beaucoup plus de sens.