🚨Opus 4.6 vừa vượt qua toàn bộ các đội ngũ an ninh mạng. 22 lỗi. 14 lỗi nghiêm trọng. 14 ngày. Hãy để điều đó ngấm vào. Và nó không chỉ dừng lại ở việc tìm ra chúng. Nó cũng viết các bản vá. Dưới đây là những gì đã giúp nó hoạt động: → Claude đã kiểm tra công việc của chính nó bằng cách sử dụng các công cụ xác minh nhiệm vụ → Xác nhận rằng lỗi thực sự đã được sửa → Xác nhận rằng không có gì khác bị hỏng trong quá trình này → Nộp các trường hợp kiểm tra tối thiểu và các bằng chứng chi tiết về khái niệm cùng với mỗi báo cáo Nhóm Firefox đã gọi các bản nộp là đáng tin cậy. Đó không phải là điều nhỏ. Hầu hết các nhà nghiên cứu con người không nộp ở tiêu chuẩn đó. Các kỹ sư an ninh mạng tính phí 200.000 đô la mỗi năm. Claude đã hoàn thành công việc hàng năm của họ trong 14 ngày.