Các tác nhân AI đã đủ tốt trong các nhiệm vụ dài hạn đến mức đây là một điểm chuyển mình trong tác động của AI tại nơi làm việc. Sự đồng thuận về điều này từ METR, GDPval và giờ là Anthropic. Nếu bạn có một công cụ tiết kiệm 8 giờ 65% thời gian, điều đó sẽ thay đổi công việc, ngay cả khi tính đến tỷ lệ lỗi tiềm năng.
Từ:
97