أندريه كارباثي ترك حاسوبه المحمول يعمل لمدة يومين.. عاد ووجد أن وكيله أجرى ~700 تجربة ووجد ~20 تحسينة فاتته كان موجها نحو نانوشات، نموذج صغير على طراز GPT كان قد ضبطه يدويا بالفعل.. يقول كارباثي إن العميل خفض "الوقت إلى GPT 2" بمقدار ~11٪، وانتقلت المكاسب من النموذج الصغير إلى النماذج الأكبر الآلية في الواقع مملة جدا: تدريبات ثابتة لمدة 5 دقائق، تسجيل على مقياس واحد، الاحتفاظ بما يتحسن، التراجع عن ما لا يتحسن، تكرار.. ~12 تجربة في الساعة تعني أنك تستيقظ على ~100 محاولة لم تقم بها بنفسك توبي لوتكه جرب نفس الفكرة على قاعدة شيفرة Shopify السائلة وأبلغ عن سرعة ~53٪ مع تخصيص كائنات أقل بنسبة 61٪ (مع ملاحظة أنه قد يكون ملاءمة زائدة).. لكن الأفكار كانت لا تزال مفيدة - حتى في مشروع استمر 20 عاما ومحسنا بشكل كبير لقد أتمتنا فقط أبطأ جزء من الهندسة والبحث.. تكرار لا يرحم أنت تكتب ملف .md.. يكتب الوكيل .py 👀