La couche 1 était un pré-entraînement non supervisé La couche 2 était un ajustement par instruction (SFT) La couche 3 est un apprentissage par renforcement (RL) AIKEK prépare les couches 4, 5 et 6