Claude Opus 4.5 вышел сегодня. Это современное решение в области кодирования, агентов и использования компьютеров, и оно значительно лучше справляется с повседневными задачами, такими как создание таблиц и слайдов. Вот что мы наблюдаем:
Постоянные отзывы от внутренних тестировщиков заключаются в том, что он просто "понимает это". Он справляется с неопределенностью, рассуждает о компромиссах без лишней помощи. Задачи, которые были почти невозможны для Sonnet 4.5, теперь стали достижимыми.
Например, мы даем кандидатам по инженерии производительности notoriously сложный экзамен на дом. В рамках 2-часового лимита Opus 4.5 набрал больше баллов, чем любой человек-кандидат когда-либо.
Это также значительно более эффективно. На SWE-bench, проверенном при среднем усилии, Opus 4.5 обходит Sonnet 4.5, используя на 76% меньше выходных токенов. Новый параметр усилия позволяет вам обменивать интеллект на стоимость/задержку с помощью одного регулятора.
295,36K