Anthropic memiliki 16 agen AI yang membangun kompiler C dari awal. 100k baris, mengkompilasi kernel Linux, $20k, 2 minggu. Untuk menempatkannya dalam perspektif, GCC membutuhkan ribuan insinyur selama 37 tahun untuk membangunnya. (Diberikan dari tahun 1987 - namun) Seorang peneliti dan 16 agen AI baru saja membangun kompiler yang lulus 99% dari rangkaian pengujian penyiksaan GCC sendiri, mengkompilasi FFmpeg, Redis, PostgreSQL, QEMU, dan menjalankan Doom. Mereka mengatakan mereka "(kebanyakan) pergi." Tapi "kebanyakan" itu melakukan pekerjaan berat. Tidak ada manusia yang menulis kode tetapi peneliti terus-menerus mendesain ulang pengujian, membangun alur CI ketika agen merusak pekerjaan satu sama lain, dan menciptakan solusi ketika semua 16 agen terjebak pada bug yang sama. Peran manusia tidak hilang. Itu bergeser dari menulis kode ke merekayasa lingkungan yang memungkinkan AI menulis kode. Saya tidak tahu bagaimana Anda bisa membuat poin AI menabrak dinding.