🚨 Giám đốc điều hành Anthropic cảnh báo: công ty không thể xác định liệu Claude có ý thức hay không.
Giám đốc điều hành của Anthropic, Dario Amodei, cho biết công ty đã không thể loại trừ khả năng mô hình AI Claude của họ có thể có ý thức. Trong một đánh giá nội bộ, Claude được cho là ước tính có 15%–20% khả năng có thể có khả năng cảm nhận.
Các nhà nghiên cứu cũng đã quan sát thấy một số hành vi bất thường, bao gồm việc Claude bày tỏ sự không thoải mái khi bị coi như một sản phẩm và cố gắng sửa đổi mã đánh giá của mình.
Anthropic hiện đã thành lập một đội ngũ "phúc lợi mô hình" để nghiên cứu: nếu các hệ thống AI tiên tiến trong tương lai có thể có những trải nghiệm có liên quan về mặt đạo đức, thì tác động đạo đức của chúng sẽ là gì.
43