O relatório técnico Kimi K2.5 acaba de ser lançado! Destaques rápidos: - Treinamento conjunto de texto e visão: pré-treinado com 15T de tokens de texto e visão, SFT (apenas texto) sem visão para ativar o raciocínio visual - Agente Swarm + PARL: sub-agentes paralelos orquestrados dinamicamente, com latência até 4,5× mais baixa, 78,4% no BrowseComp - MoonViT-3D: um codificador unificado de imagem e vídeo com compressão temporal de 4×, permitindo vídeos 4× mais longos no mesmo contexto - Toggle: RL eficiente em tokens, 25–30% menos tokens sem perda de precisão Aqui está o nosso trabalho em direção a uma inteligência agente escalável e do mundo real. Mais detalhes no relatório 👉