Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
İşte bu haftaki Ritual Research Digest, LLM'ler dünyasındaki en son gelişmeleri ve Crypto x AI'nın kesişimini kapsayan bir haber bülteni.
Haftalık olarak yayınlanan yüzlerce makale ile en son gelişmelerden haberdar olmak imkansızdır. Okumayı biz yapıyoruz, böylece sizin yapmanıza gerek kalmıyor.

Zor Düşünme: Akıl Yürütme Dili Modellerini Geliştirmek İçin Seçici Gizli Yinelemeler
Dinamik gizli yineleme zordur: tam bağlam, uyarlanabilir hedefler, parametre yeniden kullanımı gerektirir, ancak politika-kalite bağlanması eğitim istikrarsızlığına neden olur.


Bu çalışma, yalnızca sert tokenlar üzerinde yenilenen dinamik gizli düşünmeyi tanıtır; bu dinamik düşünme, özel bir model arkörü ve kararlı bir eğitim yöntemi geliştirerek, gizli yinelemeyi seçici olarak uygular.
Qwen3-0.6/1.7B-Base üzerinden ince ayarlanmış TaH, 5 mantık kıyaslamasında +%4 başarısı sağlıyor.

P1: Güçlendirme Öğrenme ile Fizik Olimpiyatlarında Ustalaşmak
Bu çalışma, OSS fizik akıl yürütme modelleri ailesi olan P1'i tanıtmaktadır. Hem tren zamanı hem de test zamanı ölçeklendirmesini entegre ederek, çıkarımda uyarlanabilir şekilde daha güçlü akıl yürütme yeteneği sağlarlar.

P1 modelleri, çok aşamalı bir RL çerçevesinde temel LM'lerde tamamen RL sonrası eğitim yoluyla eğitilir. Test zamanı için P1 modellerini PhysicsMinions ajan çerçevesi ile birleştirirler.
P1-235B-A22B modeli, IPhO 2025'te altın madalya performansı elde etti.

MiroThinker: Model, Bağlam ve Etkileşimli Ölçeklendirme Yoluyla Açık Kaynak Araştırma Ajanlarının Performans Sınırlarını Zorlamak
Makale, performansı 3 boyutta teşvik eden bir araştırma ajanı tanıtıyor: model boyutu, bağlam boyu ve etkileşim derinliği.

Derin akıl yürütme süreçlerini sürdürmek için model, 256K bağlam penceresi ve görev başına 600'e kadar araç çağrısı ile donatılmıştır.
Basit bir ReAct ajanı ile donatılmış MiroThinker v1.0, açık kaynak araştırma ajanları arasında SOTA performansı sağlar.


İyi bir yapay zeka araştırma ajanı olmak için ne gerekir? Fikir Çeşitliliğinin Rolünü İnceleme
Bu makale, ajanın fikir çeşitliliğini niceliklendirmek ve kontrol etmek için yöntemler önermektedir. Ajanik iskele seçimi, fikir çeşitliliğini önemli ölçüde etkiler.


Kontrollü deneysel tasarım aracılığıyla, fikir çeşitliliğini artırmanın MLE-bench görevlerinde performansın artmasına yol açtığını gösteren nedensel bir ilişki kurarlar. Ayrıca, alternatif performans metrikleriyle değerlendirildiğinde sağlamlık sağlanır.

DR Tulu: Derin Araştırma İçin Gelişen Rubriklerle Güçlendirme Öğrenme
Bu makale, açık uçlu, uzun biçimli derin araştırma görevleri için eğitilen derin araştırma Tulu (DR Tulu-8B) eğitimini verir.

Uzun biçimli görevlerde doğrulamayı ele almak için DR-Tulu, yüksek kaliteli kullanıcı verileri üzerinde ince ayar edilir ve ardından eğitim sırasında politika modeliyle birlikte evrimleşen rubriklerle (RLER) Gerçek Eğitim Sistemi ile eğitilir. En güçlü açık 8-32 modellerinden daha iyi sonuçlar elde ederler.

Kripto x yapay zeka araştırmasıyla ilgili her şey hakkında daha fazla bilgi için bizi @ritualdigest takip edin ve
Ritual'ın ne inşa ettiği hakkında daha fazla bilgi edinmek için @ritualnet.
3,13K
En İyiler
Sıralama
Takip Listesi

