Я написав блог про те, як ми створили субагент самотестування на основі REPL, який дозволяє від 20 хвилин до > 200 хвилин автономного виконання в Agent 3 :) Головне, що ми хотіли вирішити, — це проблема LLM, які генерують додатки, які виглядають працюючими, але насправді є лише високоякісними макетами
Replit займається створенням робочих додатків, і виявляється, що надання агенту можливості самоперевірки — це один із ключових способів отримати вищу автономію агентів
Створивши інтерфейс для агента, схожий на ноутбук, ми виявили, що це відкриває дуже людський ітеративний режим тестування, який був гнучким і масштабованим для розгортання у виробництві
105