لا أعتقد أن الناس أدركوا مدى جنون النتائج من هذه الورقة الجديدة TTT + RL من ستانفورد/نفيديا. تدريب نموذج مفتوح المصدر، هم - تجاوز Deepmind AlphaEvolve، واكتشاف حد أعلى جديد لمشكلة التداخل الأدنى لدى إردوس - طور نوى جديدة لمعالج الرسوميات A100 أسرع بمرتين من أفضل نواة بشرية - تفوق على أفضل محاولة ترميز الذكاء الاصطناعي وأفضل محاولة بشرية على AtCoder فكرة تدريب وقت الاختبار هي تدريب نموذج *بينما* يحاول حل مهمة بشكل متكرر. دمج هذا مع التعلم الواقعي كما في هذه الورقة يفتح أبواب الإمكانيات للتعلم المستمر المؤلفون: @mertyuksekgonul @LeoXinhaoLee @JedMcCaleb @xiaolonw @jankautz @YejinChoinka @james_y_zou @guestrin @sun_yu_