Agent 3'te 20 >dakika ile 200 dakikalık otonom çalışma süresine ulaşmak için REPL tabanlı bir kendi kendini test alt ajanı nasıl geliştirdiğimize dair bir blog yazısı yazdım:) Çözmek istediğimiz ana şey, LLM'lerin işe yarayan ama aslında sadece yüksek kaliteli deneme uygulamalar üretmesi sorunuydu
Replit, çalışan uygulamalar üretiyor ve ajana kendini doğrulama imkanı vermek, ajanlarda daha yüksek özerkliğin anahtarlarından biri olduğu ortaya çıktı
Ajan için notebook benzeri bir arayüz oluşturarak, üretimde uygulanabilecek esnek ve maliyet ölçeklenebilir çok insana benzeyen yinelemeli bir test modunun kilidini açtık
108