هل يقوم وكلاء البرمجة الذكاء الاصطناعي فعلا بكتابة الاختبارات؟ يعد الاختبار أمرا بالغ الأهمية لصحة البرمجيات وسهولة الصيانة. مع تزايد تقديم الوكلاء المستقلين لطلبات السحب، يصبح فهم سلوكهم في الاختبار أمرا أساسيا. تحلل هذه الدراسة الجديدة مجموعة بيانات AIDev لدراسة أنماط إدراج الاختبارات في طلبات السحب التي يولدها الوكلاء. فحصوا مدى تكرار ظهور الاختبارات، ومتى يتم تقديمها خلال دورة حياة الPR، وكيف تختلف الPRs التي تحتوي على اختبارات عن تلك التي لا تحتوي على اختبارات. تكشف النتائج عن أنماط مثيرة للاهتمام. أصبحت الPRs التي تحتوي على الاختبار أكثر شيوعا مع مرور الوقت بين الوكلاء، مما يشير إلى تحسن سلوك الاختبار. لكن هذه السجلات القياسية تميل لأن تكون أكبر وتستغرق وقتا أطول لإكمالها من السجلات القياسية غير الاختبارية. تبقى معدلات الدمج متشابهة إلى حد كبير بغض النظر عن إدراج الاختبارات. هذا يثير تساؤلات حول ما إذا كان المراجعون يقدرون الاختبارات التي ينشئها الوكلاء أم ببساطة لا يعاقبون غيابهم. يكشف هذا العمل عن اختلافات كبيرة بين الوكلاء المختلفين. بعض الوكلاء يظهرون معدلات تبني اختبارات أعلى من غيرهم. كما يختلف التوازن بين كود الاختبار وكود الإنتاج ضمن PRs المحتوية على الاختبار بشكل كبير حسب الوكيل. وهذا يشير إلى أن قدرة الاختبار ليست متطورة بشكل موحد عبر أدوات الترميز الوكيلي. بعضهم أفضل في اتباع قواعد الاختبار من غيرهم. مع اعتماد الشركات لوكلاء الترميز الذكاء الاصطناعي، فإن فهم سلوكهم في الاختبار أمر بالغ الأهمية لجودة الكود. الوكلاء الذين يتخطون الاختبارات أو يكتبون اختبارات غير كافية يخلقون ديون تقنية. يساعد هذا التأسيس التجريبي في تحديد أي الوكلاء يتماشى مع ممارسات هندسة البرمجيات الجيدة وأين تحتاج إلى تحسينات. الورقة: تعلم كيفية بناء وكلاء الذكاء الاصطناعي الفعالين في أكاديميتنا: