Agen Primitif // Ini adalah pandangan yang sangat menarik untuk membangun sistem multi-agen yang efektif. Sistem multi-agen menjadi lebih kompleks seiring dengan semakin sulitnya tugas. Lebih banyak peran, lebih banyak petunjuk, lebih banyak pola interaksi yang dipesan lebih dahulu. Namun, pola komputasi inti terus berulang di setiap sistem: meninjau, memilih, merencanakan, mengeksekusi. Tetapi tidak ada yang memperlakukan pola ini sebagai blok bangunan yang dapat digunakan kembali. Penelitian baru ini memperkenalkan Agent Primitives, seperangkat blok bangunan laten untuk membangun sistem multi-agen yang efektif. Terinspirasi oleh bagaimana jaringan saraf dibangun dari komponen yang dapat digunakan kembali seperti blok sisa dan kepala perhatian, para peneliti menguraikan arsitektur multi-agen menjadi tiga primitif berulang: Tinjauan, Pemungutan Suara dan Pemilihan, serta Perencanaan dan Eksekusi. Apa yang membuat primitif ini berbeda? Agen di dalam setiap primitif berkomunikasi melalui cache KV daripada bahasa alami. Ini menghindari degradasi informasi yang terjadi ketika agen meneruskan pesan teks panjang bolak-balik di interaksi multi-tahap. Agen Organizer memilih dan menyusun primitif untuk setiap kueri, dipandu oleh kumpulan pengetahuan ringan dari konfigurasi yang sebelumnya berhasil. Tidak diperlukan desain sistem manual. Hasil di delapan tolok ukur yang mencakup matematika, pembuatan kode, dan QA dengan lima LLM sumber terbuka: > MAS berbasis Primitif meningkatkan akurasi rata-rata sebesar 12,0-16,5% dibandingkan baseline agen tunggal > Pada GPQA-Diamond, peningkatannya mencolok, 53,2% dibandingkan dengan kisaran 33,6-40,2% dari metode sebelumnya seperti AgentVerse, DyLAN, dan MAS-GPT Dalam hal efisiensi, penggunaan token dan latensi inferensi turun sekitar 3-4x dibandingkan dengan MAS berbasis teks, sementara hanya menimbulkan overhead 1,3-1,6x relatif terhadap inferensi agen tunggal. Alih-alih merancang arsitektur multi-agen khusus tugas dari awal, Agent Primitives menunjukkan bahwa serangkaian kecil pola komputasi yang dapat digunakan kembali dengan komunikasi laten dapat mencocokkan atau melampaui sistem kustom sekaligus secara dramatis lebih efisien. Kertas: ...