Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Чи дійсно агенти програмування ШІ пишуть тести?
Тестування є критично важливим для коректності та обслуговуваності програмного забезпечення. Оскільки автономні агенти все частіше надсилають pull requests, розуміння їхньої поведінки тестування стає необхідним.
Це нове дослідження аналізує набір даних AIDev для вивчення патернів інклюзії тестів у pull requests, створених агентами.
Вони досліджували, як часто тести з'являються, коли їх вводять під час життєвого циклу PR і чим PR, що містять тести, відрізняються від тих, що не мають тестів.
Результати виявляють цікаві закономірності. PR, що містять тести, з часом стали більш поширеними серед агентів, що свідчить про покращення поведінки тестування. Але такі особисті рекорди зазвичай більші і займають більше часу, ніж не тестові.
Рівень злиття залишається здебільшого однаковим незалежно від включення тестів. Це породжує питання, чи цінують рецензенти тести, створені агентами, чи просто не карають їхню відсутність.
Ця робота виявляє значні варіації між різними агентами. Деякі агенти демонструють вищі показники впровадження тестів, ніж інші. Баланс між тестовим кодом і продакшн-кодом у межах PR, що містять тести, також суттєво відрізняється залежно від агента.
Це свідчить про те, що можливості тестування не є однорідно розвиненими серед інструментів агентного кодування. Деякі краще дотримуються тестових норм, ніж інші.
Коли компанії впроваджують агенти кодування на основі ШІ, розуміння їхньої поведінки під час тестування є ключовим для якості коду. Агенти, які пропускають тести або пишуть недостатні тести, створюють технічний борг. Ця емпірична основа допомагає визначити, які агенти відповідають хорошим практикам розробки програмного забезпечення і де потрібні покращення.
Стаття:
Навчіться створювати ефективних агентів ШІ в нашій академії:

Найкращі
Рейтинг
Вибране
