Les MoEs fonctionnent très bien pour le pré-entraînement multimodal unifié