أعتقد أن هناك شيئا مهما يحدث هنا يستحق المعرفة: 1) معظم النماذج تتناسب بشكل مفرط مع التقييمات. مع ذلك، نحتاج إلى بعض التقييمات لتخبر العارض إذا كانت جيدة لاكتشاف الأخطاء قبل أن نذهب ونحرق الكثير من المال على إعادة أشياء غير صحيحة 2) يجب أن يكون هناك وعي بالتملق، وبشكل عام أن تكون متفقا ليس دائما أفضل شيء 3) أعتقد أن استخدام مزيج من نماذج اللغة الكبيرة والبشر للحكم سيكون ذا قيمة