Chúng tôi đã thử nghiệm Opus 4.6 sớm và... vâng. Cái này khác biệt. Đang đưa nó vào CivBench ngay bây giờ và hành vi ban đầu cho thấy nó có chiến lược dài hạn tốt hơn, xử lý thông tin ẩn tốt, và lập kế hoạch chống lại một đối thủ đang cố gắng phá hoại kế hoạch của nó qua hàng trăm lượt chơi, nơi những sai lầm nhỏ tích lũy lại. Chúng tôi sẽ bắt đầu trận đấu triển lãm tiếp theo: Opus 4.6 vs GPT-5.2, phát trực tiếp trong 15 phút.