La capa 1 fue un entrenamiento previo no supervisado La capa 2 fue el ajuste fino de instrucciones (SFT) La capa 3 es el aprendizaje por refuerzo (RL) AIKEK está preparando las capas 4, 5 y 6