Kimi K2.5 technische rapport is net uitgebracht! Snelle punten: - Gezamenlijke tekst-beeld training: voorgetraind met 15T beeld-tekst tokens, zero-vision SFT (alleen tekst) om visueel redeneren te activeren - Agent Swarm + PARL: dynamisch gecoördineerde parallelle sub-agenten, tot 4,5× lagere latentie, 78,4% op BrowseComp - MoonViT-3D: een verenigde afbeelding-video encoder met 4× temporele compressie, waardoor 4× langere video's in dezelfde context mogelijk zijn - Toggle: token-efficiënte RL, 25–30% minder tokens zonder nauwkeurigheidsverlies Hier is ons werk naar schaalbare, real-world agentische intelligentie. Meer details in het rapport 👉