Sto avviando una nuova serie di interviste su @interconnectsai con tutti i principali laboratori di modelli aperti in tutto il mondo per mostrare perché le persone stanno facendo questo, come le persone addestrano grandi modelli e dove sta andando l'ecosistema. Il primo è il team di Ling di Ant Group (@AntLingAGI) / InclusionAI (@TheInclusionAI) che ha rilasciato grandi modelli quest'estate dopo aver avviato il progetto in reazione a DeepSeek. Solo 6-8 mesi! Questi modelli, Ling (modello istruzioni/base), Ring (ragionatore) e Ming (multilingue) sono un mix abbastanza standard di esperti (MoE) con parametri da 300B a 1T. Hanno anche avuto molte cose interessanti di recente sulla scalabilità della loro infrastruttura RL qui (vedi il post per una recensione di tutte le loro recenti pubblicazioni e modelli). Ant Ling/InclusionAI sembra essere uno dei laboratori che potrebbe fare il salto al livello Kimi/Qwen nel 2026 se i dadi cadono nel modo giusto. Altri arriveranno presto, poiché sembra il momento perfetto per farlo, quando i modelli aperti sono attualmente sia numerosi che estremamente performanti.