Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

karminski-牙医

Програміст, водій шосейних велосипедів, ворожка на серверах, збирач електронних відходів, співзасновник KCORES, екс-директор IllaSoft, KingsoftOffice, Juejin.

Плачу, SOTA — це просто обличчя, і треба покладатися на «модель худоби і коня», щоб справді спрацювало Алекс Аталлах, засновник OpenRouter, щойно написав у Twitter, що його найбільшим використанням є Kimi-K2-0711 (Kimi-K2-Instruct у липні). Далі є openai-o4-mini-high, claude-3.7-sonnet, gpt-oss-120b, openai-o3 Перше, що я подивився — чи ця людина не є в Інтернеті, і він давно не користувався новою великою моделлю? Але якщо добре подумати, ні, це дуже неправильно. Ось у чому справжнє призначення Power User, це так реально Якщо ви знайдете таку на цьому етапі часу, з достатньо великим контекстом (128K), сильною здатністю до використання (підтверджено SWE-bench > 65), сильними агентськими навичками (Tau2-bench > 65), величезною кількістю знань (досить велика кількість параметрів) і швидкими відповідями (не-Thinking модель), здається, що лише Kimi-K2-Instruct — це той самий. Навпаки, Алекс Аталлах, ймовірно, виконує більшість своєї роботи, працюючи з документами (довгі контексти, особливо з 13,4M токенами), використовуючи інструменти для аналізу та написання звітів (можливості агентів), що може робити Kimi-K2-Instruct, а потім пише скрипти (o4 і Claude-3.7-Sonnet покривають нижню частину і навіть обгортають його як агент для Kimi-k2, щоб викликати ці моделі для написання скриптів). Нарешті, Kimi-k2 також відповідає найважливішому пункту — конфіденційності даних, оскільки модель є відкритою, може бути розгорнута на власному сервері, і будь-яка конфіденційна інформація не буде передана OpenAI чи Anthropic. Навіть наступний GPT-OSS-120B має бути тут значущим. Я, мабуть, розумію, чому нова велика модель тепер наповнена агентськими можливостями, а пряме використання ШІ людьми лише на середньому етапі, і просунуті користувачі вже використовували ШІ для роботи з ШІ. Агент-специфічна модель, яка використовується для надсилання та отримання всіх контекстів ШІ, неминуче буде найпопулярнішим. Оригінальна тема:

Найкращі

Рейтинг

Вибране