@PrimeIntellectをGLM 4.6Vの全RLパイプラインとNemotron Security Finetuneで使っていて、今までで一番強い確信が湧いていて、とてもシンプルです Prime-RL + Verifiers + Env Hub + ホストトレーニング(モーダルクレジット😋があるので使いませんが、とても良いです)。モデルを何ででもトレーニングでき、15分以内、あるいはそれより速く始められます