Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
İşte bu haftaki Ritual Research Digest, LLM'ler dünyasındaki en son gelişmeleri ve Crypto x AI'nın kesişimini kapsayan bir haber bülteni.
Haftalık olarak yayınlanan yüzlerce makale ile en son gelişmelerden haberdar olmak imkansızdır. Okumayı biz yapıyoruz, böylece sizin yapmanıza gerek kalmıyor.

RefineBench: Dil Modellerinin Geliştirme Yeteneğinin Kontrol Listeleri Yoluyla Değerlendirilmesi
Bu makale, LM'lerin çeşitli senaryolarda iyileştirme yeteneklerini değerlendiren bir kıyaslama olan RefineBench'i tanıtmaktadır. Hem serbest biçim hem de doğruluk temelli görevleri içerir.

Beşeri bilimler, sosyal bilimler, hukuk ve STEM alanlarında 11 alanı kapsar. Bu iki şekilde değerlendirilir: kendini geliştirme ve rehberli iyileştirme. Kendini geliştirme ortamında, sınır LM'leri bile nispeten düşük puan alırken, rehberli iyileştirme çok etkilidir.


ThetaEvolve: Açık Problemler Üzerine Test Zamanı Öğrenimi
Makale, zorlu sorunların üstesinden gelmek için açık kaynaklı bir ürün hattı önermektedir. Bunlar, DeepSeek-R1-0528-Qwen3-8B'nin AlphaEvolve'da ele alınan bazı açık problemlerin en bilinen sınırlarını geliştirdiğini gösteriyor.

ThetaEvolve'daki RL, 2 OSS modeli ve 4 zorlu problemde sadece çıkarım gerektiren çalışmaları geride bırakıyor. Modelin daha iyi puanlar ve daha hızlı ilerlemelerle kanıtlandığı gibi basit olmayan yetenekler kazandığını gösteriyorlar. Bu gelişme diğer görevlere de yansıyor.

Gerçek Yetim Sonrası Eğitim Beceri Bileşimini Nasıl Tetikler? Geri Sayım Üzerine Bir Vaka Çalışması
Makale, RL'nin bir modelin geri sayım yardımıyla yazma becerilerini öğrenmesine nasıl yardımcı olabileceğini inceliyor. Uzunluk ve bileşimsel genellemeyi çözerler.

Şöyle bulurlar:
1) Modeller daha büyük bulmaca boyutlarına genelleştirir
2) Desen yapısı zorluğu belirler
3) Modeller görünmeyen desenlere genelleştirir
Sonuç olarak, gerçek eğitim sonrası eğitimin uzunluk genellemesi ve kısmi bileşimsel genellemeye yardımcı olduğunu göstermek


DeepSeek-V3.2: Açık Büyük Dil Modellerinin Sınırlarını İşterek
Makale, uzun bağlam senaryolarında performansı korurken hesaplama karmaşıklığını azaltmak için Deepseek seyrek dikkat içeren DS-V3.2'yi tanıtmaktadır.

Gerçek Anlamda Gerçek Düzey Pozisyon Çalışması için, uzman damıtma (alan başına uzman modeller nihai kontrol noktasını eğitmek için veri damıtılır) ve karışık RL eğitimi (birleştirme akıl yürütme, ajan ve insan hizalanması bir aşamada) kullanırlar.
DSmath-V2 kullanarak özel bir model eğitiler ve bence altın puan alıyorlar.


Kripto x yapay zeka araştırmasıyla ilgili her şey hakkında daha fazla bilgi için bizi @ritualdigest takip edin ve
Ritual'ın ne inşa ettiği hakkında daha fazla bilgi edinmek için @ritualnet.
364
En İyiler
Sıralama
Takip Listesi
