Não escreva prompts e assista vídeos em vez disso! Kimi-K2.5 Medido! O lado sombrio da lua lançou um novo modelo, o Kimi-K2.5, e a maior atualização é que ele finalmente se tornou um modelo unificado, não apenas suportando texto e imagens, mas também entrada de vídeo! Trazendo para você os resultados medidos do Pensamento Kimi-K2.5: Encontrei uma página web de efeitos animativos muito legais com fundo de cinto de asteroide + interação com o mouse + alternância de rolagem, e então gravei a tela para ele, e passei o vídeo de gravação da tela para o Kimi-K2.5 - Pensando em fazer, dou 80 pontos por essa restauração, exceto pelo efeito flexível de dobragem do material que não foi realizado, todo o resto está bem bom. Detalhes do teste de habilidade de programação: O teste da pasta de dente de elefante explodiu, e esse efeito parecia difícil de rivalizar no curto prazo; O teste de despejamento do copo em Python seguiu diretamente o Claude-Sonnet, e não conseguiu pingar na lateral sem a ajuda da hipotenusa (embora haja espaço para melhorias no desempenho, colisão de partículas é O(n²), 400 partículas são contadas como 80.000 vezes por quadro, deixei otimizar com malha espacial e ficou suave). Habilidade de agente que usei por 40 minutos com um teste de cavaleiro baseado em silício, queimei 10 milhões de tokens, e a maior pontuação foi 543,94, que foi o primeiro escalão. A recordação de contexto longo também é estável, com mais de 85%, mas a censura é um pouco rigorosa, e o conteúdo do romance é fácil de julgar mal e sensível (foi relatado que o oficial está sendo revisado). Resumo: Os algoritmos de programação e o desempenho foram aprimorados, as capacidades de Python estão diretamente no primeiro escalão, e o Agent e o longo contexto estão online. O mais importante é a modalidade de vídeo, já pensei em uma nova forma de jogar - faça um MCP com câmera e deixe que ele me ajude a olhar para a tela haha! #KimiK25 #Kimi #月之暗面 #KCORES大模型竞技场 #AIAgent #全模态模型 #AI开始使唤AI干活了