Berikut adalah Ritual Research Digest minggu ini, buletin yang mencakup yang terbaru di dunia LLM dan persimpangan Crypto x AI. Dengan ratusan makalah yang diterbitkan setiap minggu, tidak mungkin mengikuti perkembangan terbaru. Kami melakukan pembacaan sehingga Anda tidak perlu melakukannya.
DeepSeekMath-V2: Menuju Penalaran Matematis yang Dapat Diverifikasi Sendiri Makalah ini memperkenalkan DSMath-V2, model yang dilatih pada deepseek-3.2-exp untuk pembuktian bahasa alami dalam matematika. Kesenjangan verifikasi generasi merupakan rintangan utama untuk pembuktian informal.
Mereka pertama-tama melatih verifikator untuk model menggunakan anotasi ahli untuk menilai kebenaran jawaban dan analisis. Verifikator ini digunakan untuk melatih model pembuktian akhir, yang menulis bukti dan menganalisis kebenarannya. Mereka meraih emas di IMO 2025.
Hivemind Buatan: Homogenitas Model Bahasa Terbuka (dan Seterusnya) Makalah ini memperkenalkan INFINITY-CHAT, kumpulan data 26K kueri dunia nyata yang menerima banyak jawaban. Dengan menggunakan ini, mereka mempelajari keruntuhan mode intra & antar-model di 70+ LM.
Mereka mengungkap efek Artificial Hivemind dengan pengulangan intra-model, di mana model berulang kali menghasilkan output yang serupa, & homogenitas antar-model, di mana model yang berbeda berkumpul pada ide-ide serupa dengan perubahan frasa kecil. Hal ini menimbulkan pertanyaan tentang keragaman model.
Kolaborasi Laten dalam Sistem Multi-Agen Karya ini memperkenalkan Latent MAS, kerangka kerja kolaboratif end-to-end yang beroperasi dalam ruang laten berkelanjutan. Desainnya mengintegrasikan generasi pemikiran laten dan transfer memori laten lintas agen.
LatentMAS didasarkan pada ekspresi penalaran, kesetiaan komunikasi, dan kompleksitas kolaborasi. Di seluruh pengaturan MAS berurutan dan hierarkis, Qwen 3(4B, 8B, dan 14B), LatentMAS mengungguli garis besar MAS berbasis teks yang meningkatkan akurasi, & mengurangi penggunaan token output.
ToolOrchestra: Meningkatkan Kecerdasan melalui Model yang Efisien dan Orkestrasi Alat Para penulis mengusulkan paradigma orkestrasi di mana kecerdasan muncul dari sistem komposit. Model orkestrator memanggil alat yang tepat dalam urutan yang benar untuk suatu tugas.
Menggunakan ToolOrchestra, model 8B dilatih dengan RL untuk memutuskan kapan dan bagaimana memanggil LM dan alat lain. Hadiah menyeimbangkan kebenaran, efisiensi, dan keselarasan dengan preferensi pengguna. Pada HLE, Orchestrator mengungguli metode sebelumnya dengan biaya komputasi yang jauh lebih rendah.
Ikuti kami @ritualdigest untuk informasi lebih lanjut tentang semua hal tentang penelitian crypto x AI, dan @ritualnet untuk mempelajari lebih lanjut tentang apa yang dibangun Ritual.
3,35K