Sonnet 4.5 vừa được phát hành – nó chiếm vị trí #1 trong các tiêu chuẩn tài chính và lập trình của chúng tôi! Chúng tôi đã có cơ hội thử nghiệm mô hình mới @claudeai trước khi ra mắt và thấy nó cực kỳ khả năng, đặc biệt là cho các ứng dụng tác động.
(1/6)
GPT-5 Codex đã đạt được hiệu suất ấn tượng trên hầu hết mọi tiêu chuẩn mà chúng tôi đã đánh giá! Điều đáng chú ý nhất là sự cải thiện 10% trong Terminal-Bench so với #1 trước đó, GPT-5. Chúc mừng đội ngũ @OpenAI về một mô hình lập trình mạnh mẽ!
(1/6)