Vi har evaluert mange basismodeller på perplexitetsbaserte evalueringer, og Kimi k2.5 viste seg å være den sterkeste! Etter det fortsetter vi med fortrening og høy-compute RL (en 4x oppskalering). Kombinasjonen av den sterke basen, CPT og RL, og Fireworks' inferens- og RL-samplere gjør Composer-2 til et grensenivå. Det var en feil å ikke nevne Kimi-basen i bloggen vår fra starten av. Vi fikser det for neste modell.