İşte bu haftaki Ritual Research Digest, LLM'ler dünyasındaki en son gelişmeleri ve Crypto x AI'nın kesişimini kapsayan bir haber bülteni. Haftalık olarak yayınlanan yüzlerce makale ile en son gelişmelerden haberdar olmak imkansızdır. Okumayı biz yapıyoruz, böylece sizin yapmanıza gerek kalmıyor.
DeepSeekMath-V2: Kendi Kendini Doğrulanabilir Matematiksel Akıl Yürütmeye Doğru Bu makale, matematikte doğal dil kanıtlaması için deepseek-3.2-exp üzerinde eğitilmiş DSMath-V2 modelini tanıtmaktadır. Nesil doğrulama farkı, gayri resmi kanıtlama için büyük bir engeldir.
Önce model için uzman açıklamaları kullanarak hem cevapların hem de analizin doğruluğunu değerlendirmek için bir doğrulayıcı eğitiliyor. Bu doğrulayıcı, hem kanıtlar yazan hem de doğruluğunu analiz eden nihai kanıtlayıcı modelini eğitmek için kullanılır. IMO 2025'te altın medal elde ettiler.
Yapay Zihin: Dil Modellerinin Açık Uçlu Homojenliği (ve Ötesi) Makale, birden fazla yanıtı kabul eden 26K gerçek dünya sorgularından oluşan bir veri seti olan INFINITY-CHAT'i tanıtıyor. Bunu kullanarak 70+ LM'de model içi ve modeller arası mod çöküşünü incelerler.
Modelin tekrar tekrar eden model içi tekrarlarla benzer çıktılar ürettiği Yapay Kovan Zihni etkisini ve farklı modellerin küçük ifadeleme değişiklikleriyle benzer fikirler üzerinde birleştiği modeller arası homojenliği ortaya çıkarırlar. Bu durum model çeşitliliği hakkında sorular doğurmaktadır.
Çok Ajanlı Sistemlerde Gizli İşbirliği Çalışma, sürekli gizli alanda çalışan uçtan uca işbirlikçi bir çerçeve olan Latent MAS'ı tanıtıyor. Tasarım, hem gizli düşünce üretimini hem de çapraz ajanlar arası gizli bellek transferini entegre eder.
LatentMAS, akıl yürütme ifadesi, iletişim doğruluğu ve iş birliği karmaşıklığına dayanır. Hem sıralı hem de hiyerarşik MAS ayarlarında, Qwen 3(4B, 8B ve 14B), LatentMAS metin tabanlı MAS bazlarını geride bırakarak doğruluğu artırır ve çıkış token kullanımını azaltır.
ToolOrchestra: Verimli Model ve Araç Orkestrasyonu Yoluyla Zekâyı Yükseltmek Yazarlar, zekanın bileşik bir sistemden ortaya çıktığı bir orkestrasyon paradigması önerirler. Bir orkestratör modeli, bir görev için doğru araçları doğru sırayla çağırır.
ToolOrchestra kullanılarak, bir 8B modeli RL ile eğitilerek diğer LM'lerin ve araçların ne zaman ve nasıl çağrılacağına karar verilir. Ödüller, doğruluğu, verimliliği ve kullanıcı tercihleriyle uyumu dengeler. HLE'de Orchestrator, önceki yöntemleri çok daha düşük hesaplama maliyetiyle geride bırakır.
Kripto x yapay zeka araştırmasıyla ilgili her şey hakkında daha fazla bilgi için bizi @ritualdigest takip edin ve Ritual'ın ne inşa ettiği hakkında daha fazla bilgi edinmek için @ritualnet.
3,22K