Талантливые люди получают повышение до управленческих позиций. То же самое касается талантливых моделей. Клод управляет выполнением кода. Gemini маршрутизирует запросы через CRM и чат. GPT-5 может координировать публичные исследования акций. Почему сейчас? Точность вызова инструментов пересекла порог. Два года назад GPT-4 справлялся с менее чем 50% задач по вызову функций. Модели создавали иллюзии параметров, вызывали неправильные конечные точки, забывали контекст в середине разговора. Сегодня модели SOTA превышают 90% точности по бенчмаркам вызова функций. Производительность самых последних моделей, таких как Gemini 3, на практике значительно лучше, чем предполагают бенчмарки.
Нужны ли нам модели с триллионом параметров только для выполнения функций? Удивительно, но да. Эксперименты с небольшими моделями действий, легковесными сетями, обученными только для выбора инструментов, терпят неудачу в производстве. Им не хватает знаний о мире. Оказалось, что управление требует контекста. Сегодня оркестратор часто сам становится субагентом (Claude Code запускает другой Claude Code). Эта симметрия не продлится долго. Горький урок настаивает на том, что все более крупные модели должны справляться со всем. Но экономика противится: дистилляция и дообучение с подкреплением создают модели на 40% меньше и на 60% быстрее, сохраняя 97% производительности. Специализированные агенты от разных поставщиков появляются на рынке. Граничная модель становится исполнительным органом, маршрутизируя запросы между специалистами. Эти специалисты могут быть сторонними поставщиками, все стремятся быть лучшими в своей области.
63