Не пишіть підказки, а краще дивіться відео! Kimi-K2.5 виміряно! Dark Side of the Moon випустила нову модель — Kimi-K2.5, і найбільшим оновленням стало те, що вона нарешті стала єдиною моделлю, яка підтримує не лише текст і зображення, а й відеоввод! Пропонуємо виміряні результати Kimi-K2.5-Thinking: Я знайшов класну вебсторінку з ефектами анімації з фоном пояса астероїдів + взаємодією миші + перемиканням прокрутки, потім записав екран на нього і передав відеозапис Kimi-K2.5-Thinking, я даю 80 балів за цю реставрацію, окрім ефекту гнучкого згинання матеріалу не реалізовано, все інше досить добре. Деталі тесту програмних здібностей: Тест із зубною пастою «слона» вибухнув, і цей ефект здавався важким для зрівняння у короткостроковій перспективі; Тест наливання чашки Python відбувся безпосередньо після Клода-Сонета і не виявив капання з боку без допомоги гіпотенузи (хоча є куди покращити продуктивність, зіткнення частинок — O(n²), 400 частинок рахуються як 80 000 разів за кадр, я дозволив оптимізувати це за допомогою просторової сітки, і це гладко). Здібність агента я провів 40 хвилин із тестом на вершника на основі кремнію, витратив 10 мільйонів токенів, і найвищий бал склав 543,94 — це був перший ешелон. Відкликання довгого контексту також стабільне на рівні понад 85%, але цензура досить сувора, а зміст роману легко неправильно оцінити і він чутливий (повідомлялося, що офіційний текст переглядається). Резюме: Алгоритми програмування та продуктивність покращені, можливості Python знаходяться безпосередньо на першому рівні, а Agent і довгий контекст — онлайн. Найважливіше — це відео-модальність, я вже придумав новий спосіб гри — зробити камеру MCP і дозволити їй дивитися на екран, ха-ха! #KimiK25 #Kimi #月之暗面 #KCORES大模型竞技场 #AIAgent #全模态模型 #AI开始使唤AI干活了