Nie piszę promptów, tylko oglądam filmy! Kimi-K2.5 test w praktyce! Mroczna strona Księżyca opublikowała nowy model Kimi-K2.5, największą aktualizacją jest to, że w końcu stał się modelem uniwersalnym, który wspiera nie tylko tekst i obrazy, ale także wejścia wideo! Przedstawiam wyniki testu Kimi-K2.5-Thinking: Znalazłem stronę internetową z fajną animacją, która ma tło z pasem asteroidów + interakcję myszką + przewijanie, a następnie nagrałem ekran, wrzucając nagrany film do Kimi-K2.5-Thinking. Oceniam to na 80 punktów, poza tym, że efekt zginania materiałów elastycznych nie został zrealizowany, reszta jest całkiem dobra. Szczegóły testu umiejętności programowania: Test z pastą do zębów dla słoni był niesamowity, ten efekt w krótkim czasie wydaje się trudny do pokonania; test z kubkiem Pythonem, który przelewa wodę, goni Claude-Sonnet, osiągając bez pomocniczej przekątnej efekt, w którym woda nie kapie z boku (choć wydajność ma jeszcze pole do poprawy, kolizje cząsteczek są O(n²), 400 cząsteczek wymaga obliczenia 80 tysięcy razy na klatkę, poprosiłem, aby zoptymalizował to za pomocą podziału przestrzennego, co uczyniło to płynniejszym). Test umiejętności Agenta przeprowadziłem z użyciem krzemowego jeźdźca przez 40 minut, zużywając 10 milionów tokenów, osiągając najwyższy wynik 543.94, co zapewnia mu miejsce w pierwszej lidze. Stabilność przypomnienia długiego kontekstu również utrzymuje się powyżej 85%, jednak cenzura jest dość surowa, treści powieściowe łatwo są błędnie klasyfikowane jako wrażliwe (zgłoszono to oficjalnie do naprawy). Podsumowanie: Algorytmy programowania i wydajność uległy poprawie, umiejętności Pythona są teraz w pierwszej lidze, Agent i długi kontekst są online. Najważniejsze jest to, że tryb wideo, już wymyśliłem nowy sposób zabawy - zrobić kamerę MCP, aby pomogła mi pilnować ekranu i pracować, haha! #KimiK25 #Kimi #月之暗面 #KCORES大模型竞技场 #AIAgent #全模态模型 #AI开始使唤AI干活了