Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Плачу, SOTA — це просто обличчя, і треба покладатися на «модель худоби і коня», щоб справді спрацювало
Алекс Аталлах, засновник OpenRouter, щойно написав у Twitter, що його найбільшим використанням є Kimi-K2-0711 (Kimi-K2-Instruct у липні).
Далі є openai-o4-mini-high, claude-3.7-sonnet, gpt-oss-120b, openai-o3
Перше, що я подивився — чи ця людина не є в Інтернеті, і він давно не користувався новою великою моделлю?
Але якщо добре подумати, ні, це дуже неправильно. Ось у чому справжнє призначення Power User, це так реально
Якщо ви знайдете таку на цьому етапі часу, з достатньо великим контекстом (128K), сильною здатністю до використання (підтверджено SWE-bench > 65), сильними агентськими навичками (Tau2-bench > 65), величезною кількістю знань (досить велика кількість параметрів) і швидкими відповідями (не-Thinking модель), здається, що лише Kimi-K2-Instruct — це той самий.
Навпаки, Алекс Аталлах, ймовірно, виконує більшість своєї роботи, працюючи з документами (довгі контексти, особливо з 13,4M токенами), використовуючи інструменти для аналізу та написання звітів (можливості агентів), що може робити Kimi-K2-Instruct, а потім пише скрипти (o4 і Claude-3.7-Sonnet покривають нижню частину і навіть обгортають його як агент для Kimi-k2, щоб викликати ці моделі для написання скриптів).
Нарешті, Kimi-k2 також відповідає найважливішому пункту — конфіденційності даних, оскільки модель є відкритою, може бути розгорнута на власному сервері, і будь-яка конфіденційна інформація не буде передана OpenAI чи Anthropic. Навіть наступний GPT-OSS-120B має бути тут значущим.
Я, мабуть, розумію, чому нова велика модель тепер наповнена агентськими можливостями, а пряме використання ШІ людьми лише на середньому етапі, і просунуті користувачі вже використовували ШІ для роботи з ШІ. Агент-специфічна модель, яка використовується для надсилання та отримання всіх контекстів ШІ, неминуче буде найпопулярнішим.
Оригінальна тема:


Найкращі
Рейтинг
Вибране
