Сонет 4.5 только что был выпущен – он занимает 1-е место в наших финансовых и программных бенчмарках! У нас была возможность протестировать новую модель @claudeai до запуска и мы обнаружили, что она исключительно способна, особенно для агентных приложений.
(1/6)
GPT-5 Codex продемонстрировал впечатляющие результаты по почти всем критериям, которые мы оценивали! Наиболее примечательным является его улучшение на 10% в Terminal-Bench по сравнению с предыдущим #1, GPT-5. Поздравляем команду @OpenAI с сильной моделью кодирования!
(1/6)