Anthropic vừa công bố một điều lớn lao cho các nhà phát triển - một lần nữa! Đánh giá mã Claude Code giờ đây thực hiện đánh giá mã đa tác nhân trên mọi PR. Khi một PR được mở: • Một đội ngũ các tác nhân AI tìm kiếm lỗi song song • Mỗi lỗi được xác minh để giảm thiểu các kết quả dương tính giả • Các vấn đề được xếp hạng theo mức độ nghiêm trọng Kết quả từ thử nghiệm nội bộ: → Các PR có nhận xét đánh giá có ý nghĩa: 16% → 54% → <1% các phát hiện được đánh dấu là không chính xác → Các PR lớn nổi bật trung bình 7.5 vấn đề AI đánh giá mã có thể sớm trở thành tiêu chuẩn.