Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Penelitian BARU dari Meta Superintelligence Labs.
Ini menggunakan kerangka kerja lelang strategi yang cerdas untuk meningkatkan agen perbaikan diri pada tugas-tugas yang kompleks.
Agen kecil tidak selalu cukup.
Pada tugas yang paling sederhana, agen parameter 4B mencapai 87% dari kinerja agen 32B. Tetapi pada tugas yang paling kompleks, kinerja relatif itu turun menjadi hanya 21%.
Asumsi default hari ini adalah bahwa Anda menggunakan model terbesar untuk semuanya atau merutekan tugas dengan pengklasifikasi terlatih.
Tetapi router terlatih menurun seiring dengan meningkatnya kesulitan tugas, dan kaskade non-prediktif menjadi sangat mahal untuk beban kerja agen.
Penelitian baru ini memperkenalkan SALE (Strategy Auctions for Workload Efficiency), kerangka kerja yang terinspirasi oleh pasar pekerja lepas. Alih-alih memprediksi model mana yang akan digunakan dari deskripsi tugas saja, agen menawar dengan rencana strategis pendek yang dinilai oleh mekanisme nilai-biaya yang sistematis.
Bagaimana cara kerja lelang? Setiap agen kandidat mengusulkan rencana solusi strategis. Juri sebaya menilai rencana berdasarkan nilai yang diprediksi. Prediktor biaya heuristik memperkirakan biaya eksekusi. Agen dengan trade-off nilai-biaya terbaik menang dan mengeksekusi rencananya.
Mekanisme pengembangan diri adalah tempat yang menarik. Setelah setiap lelang, semua strategi yang diusulkan disimpan dalam bank memori bersama. Agen yang lebih murah yang kalah dapat belajar dari strategi pemenang dan mengajukan tawaran yang disempurnakan, analog dengan peningkatan keterampilan freelancer dari waktu ke waktu.
Pada tugas pencarian mendalam, SALE melampaui pass@1 agen tunggal terbaik sebesar 3,5 poin sekaligus mengurangi biaya sebesar 35%. Pada tugas pengkodean, ini meningkatkan pass@1 sebesar 2,7 poin dengan biaya 25% lebih rendah. Di kedua domain, SALE mengurangi ketergantungan pada agen terbesar sebesar 53%.
Router yang ada seperti WTP dan FrugalGPT berkinerja buruk dari agen terbesar atau gagal mengurangi biaya. Biaya FrugalGPT sebenarnya meningkat pada tugas pengkodean yang kompleks, mencapai 0,61 dolar per juta token versus 0,36 dolar agen terbaik.
Mekanisme koordinasi yang terinspirasi pasar yang mengatur agen heterogen ke dalam ekosistem adaptif dapat secara sistematis mengungguli model besar tunggal dan pendekatan perutean terlatih.
Kertas:
Pelajari cara membangun Agen AI yang efektif di akademi kami:

Teratas
Peringkat
Favorit
