لقد كتبت للتو مدونة عن كيفية ابتكارنا لأول نسخة من الكأس (grail-v0)، وهو نظام تدريب مفتوح وغير مركزي للتعلم المعزز لنماذج اللغة الكبيرة. واحدة من أولى أنواعها. كل شيء متاح للعامة: قاعدة الكود، حلقة التدريب، منحنيات التدريب المباشرة، الحوافز، الإطلاقات. 🧵 ربع