رأي ساخن: التعلم الواقعي من المكافآت "الرقمية" هو مجرد سهولة / كسلنا - وليس هذا النموذج الصحيح لنماذج اللغة الكبيرة. الرموز الداخل والرموز تخرج من FTW