Andrej Karpathy dizüstü bilgisayarını iki gün boyunca açık bıraktı.. Geri döndüğünde ajanı ~700 deney yaptı ve kaçırdığı ~20 iyileştirme buldu Nanochat'e doğrulttu, zaten elle ayarladığı küçük bir GPT tarzı model... Karpathy, ajanın "GPT 2'ye kadar süre" süresini ~%11 azalttığını ve kazançların küçük modelden daha büyük modellere aktarıldığını söylüyor Mekanizma aslında oldukça sıkıcı: sabit 5 dakikalık antrenman koşuları, bir ölçüğe göre puan, iyileşeni tut, gelişmeyenleri geri al, döngü.. ~12 deney/saat, şahsen yapmadığın ~100 denemeyle uyanman anlamına geliyor Tobi Lütke aynı fikri shopify'ın likit kod tabanında denedi ve %61 daha az nesne tahsisiyle ~%53 daha hızlı olduğunu bildirdi (belki fazla uygun olabilir).. Ama fikirler hâlâ faydalıydı - 20 yıl, yoğun şekilde optimize edilmiş bir projede bile Mühendislik ve araştırmanın en yavaş kısmını otomatikleştirdik.. Amansız Yineleme .md dosyasını yazıyorsun.. Ajan .py 👀 yazar