Mistral parece estar a punto de lanzar 2 nuevos modelos: Ministral 3 y Mistral Large 3. En cuanto a la arquitectura, parece ser: > exactamente la misma que llama2/3 para Ministral, que es muy similar (incluso si añaden SWA) a la primera versión de Mistral 7B hace 2 años. > exactamente la misma arquitectura que DeepSeek V3 para el grande (que parece ser un MoE) Para ambos, también utilizan el escalado de cuerda de llama4 (en lugar de hilo), y para el grande parecen implementar decodificación especulativa con eagle enlace a prs en el hilo