私たちは多くのベースモデルをパープレキシティベースの評価で評価しましたが、Kimi k2.5が最も優れていることが証明されました! その後は、プレトレーニングと高計算量の強化学習(4倍のスケールアップ)を継続します。 強力なベース、CPTとRL、そしてFireworksの推論とRLサンプラーの組み合わせにより、Composer-2は最先端のレベルとなっています。 ブログの冒頭からキミ基地について触れなかったのは失敗でした。次のモデルでそれを直します。