レイヤー 1 は教師なしの事前トレーニングでした レイヤー 2 は微調整 (SFT) を指示しました レイヤー3は強化学習(RL)です AIKEKはレイヤー4、5、6を準備しています