Sistem multi-agen sering mengecewakan? Masalahnya mungkin bukan pada agen itu sendiri, tetapi pada bagaimana mereka diatur. Sebagian besar sistem memiliki struktur rantai, pohon, atau grafik tetap yang tidak dapat disesuaikan saat tugas berubah. Tetapi bagaimana jika sistem dapat mempelajari model kolaborasinya sendiri? Makalah blockbuster ini memperkenalkan kerangka kerja yang disebut Puppeteer, yang secara dinamis mengatur agen daripada mengandalkan topologi yang telah dirancang sebelumnya. Kuncinya adalah: • Tidak lagi struktur kolaborasi yang telah ditentukan sebelumnya, tetapi agen yang koordinatornya memilih pembicara berikutnya berdasarkan perubahan status percakapan. • Melatih strategi menggunakan algoritme REINFORCE untuk mengoptimalkan tingkat keberhasilan tugas secara langsung. • Hindari kompleksitas kombinatorial dengan membuat serial semuanya menjadi pemilihan agen berkelanjutan alih-alih mencari topologi grafik yang kompleks. Hasilnya mengejutkan: Alih-alih struktur grafik yang besar, pola siklik kompak terbentuk secara alami, di mana 2-3 agen menangani sebagian besar pekerjaan. Yang lebih kuat adalah bahwa sistem dapat secara mandiri menemukan efisiensi. Tampilan Pencapaian: • Pada soal matematika GSM-Hard: akurasi 70% (dibandingkan dengan 13,5% ketika model fondasi digunakan sendiri). • Pada MMLU-Pro: mencapai 83% (76% pada baseline). • Pada pengembangan perangkat lunak SRDD: mencapai 76,4% (baseline 60,6%). Peningkatan ini disertai dengan penurunan konsumsi token. Makalah ini menunjukkan bahwa biaya token terus menurun sementara kinerja meningkat selama pelatihan. Mereka juga menunjukkan bahwa proses pemilihan agen memenuhi properti Markov, yang berarti bahwa keadaan saat ini menentukan agen berikutnya yang optimal tanpa perlu melacak riwayat lengkap. Jadi: Bagi pengembang AI, kesederhanaan pembelajaran lebih besar daripada kompleksitas desain yang cermat. Router terlatih dengan beberapa agen khusus mengungguli alur kerja yang dirancang dengan baik sekaligus mengurangi overhead komputasi.
Tautan kertas:
1,7K