Sonnet 4.5 щойно вийшов – він займає #1 місце в наших тестах фінансів та програмування! У нас була можливість протестувати нову модель @claudeai перед запуском і виявилося, що вона надзвичайно ефективна, особливо для агентних додатків.
(1/6)
GPT-5 Codex досяг вражаючої продуктивності майже в кожному тесті, який ми оцінювали! Найбільш помітним є покращення на 10% у Terminal-Bench порівняно з попереднім #1, GPT-5. Вітаємо команду @OpenAI з сильною моделлю кодування!
(1/6)