- Nếu bạn tiếp tục xu hướng METR, bạn sẽ thấy các mô hình ~100h vào cuối năm! (~8x mạnh mẽ hơn bây giờ) - METR sẽ thực sự gặp khó khăn để có được các tiêu chuẩn cần thiết để đánh giá các mô hình có sức mạnh đó - Chúng ta không thể loại trừ việc tự động hóa đáng kể trong phát triển AI NĂM NAY nữa.
Ajeya Cotra
Ajeya Cotra23:17 5 thg 3
Bài viết mới: vào ngày 14 tháng 1, tôi đã dự đoán rằng thời gian chân trời SWE đến cuối năm sẽ khoảng ~24 giờ. Bây giờ tôi nghĩ nó sẽ >100 giờ, và có thể không giới hạn. Lần đầu tiên, tôi không thấy bằng chứng vững chắc nào chống lại tự động hóa R&D AI *năm nay.* Liên kết bên dưới.
@Douglas_Schon Tỷ lệ trung bình p80/p50 là ~0.19... nó rất ổn định.
@djinnius @microfounded @eli_lifland Tôi cũng có một Substack
142