Andrej Karpathy membiarkan laptopnya berjalan selama dua hari. kembali dan agennya telah menjalankan ~700 eksperimen dan menemukan ~20 peningkatan yang dia lewatkan Itu diarahkan ke nanochat, model gaya GPT kecil yang sudah dia setel dengan tangan. Karpathy mengatakan agen memangkas "waktu ke GPT 2" sebesar ~11%, dan keuntungan ditransfer dari model kecil ke model yang lebih besar Mekanismenya sebenarnya cukup membosankan: memperbaiki latihan 5 menit, mencetak skor terhadap satu metrik, menjaga apa yang ditingkatkan, mengembalikan apa yang tidak, berulang.. ~12 eksperimen/jam berarti Anda bangun dengan ~100 upaya yang tidak Anda jalankan secara pribadi Tobi Lütke mencoba ide yang sama di basis kode cair Shopify dan melaporkan ~53% lebih cepat dengan alokasi objek 61% lebih sedikit (dengan peringatan itu mungkin terlalu pas). Tetapi ide-ide itu masih berguna - bahkan dalam proyek 20 tahun yang sangat dioptimalkan Kami baru saja mengotomatiskan bagian paling lambat dari teknik dan penelitian. Iterasi tanpa henti Anda menulis file .md.. Agen menulis .py 👀