Mistral tampaknya akan merilis 2 model baru: Ministral 3 dan Mistral Large 3. dari segi arsitektur tampaknya: > persis sama dengan llama2/3 untuk Ministral, yang sangat mirip (bahkan jika mereka menambahkan SWA) dengan rilis Mistral 7B pertama 2 tahun yang lalu. > arsitektur yang persis sama dengan DeepSeek V3 untuk yang besar (yang tampaknya merupakan MoE) untuk keduanya, mereka juga menggunakan penskalaan tali llama4 (bukan benang), dan untuk yang Besar mereka tampaknya menerapkan decoding spekulatif dengan elang Tautan ke PRS di utas