Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bugün Nomos 1'i açık kaynak olarak sunuyoruz. Sadece 30B parametresiyle bu yılki dünyanın en prestijli matematik yarışmalarından biri olan Putnam'da 87/120 puan alıyor.
Bu puan 2024'te #2/3988 sırasına girecek ve SOTA AI matematikçisi yaratma yolunda @hillclimbai ilk adımımızı işaret ediyor.

Nomos 1 8 mükemmel puanla 87/120 puan alırken, Qwen3-30ba3b-Thinking-2507 aynı koşumda aynı koşumda koşulduğunda 24/120 puan aldı; bu da performansın büyük ölçüde koşum sonrası ve veri kalitesine bağlı olduğunu gösteriyor.

Gönderimler, insan Putnam ilk 200 yarışmacısı tarafından kör notlandırıldı ve anonim gönderiler verildi.
İnsan annotatörlerimize derecelendirme için gönderilen tam dosyalar burada anonim olarak sunulur: , ve bunları oluşturmak için kullanılan runbooklar
Yarışmacılarla aynı zaman sınırlarını kullandık - her iki bölüm için 3 saat.
Açık kaynak akıl yürütme sistemimiz, çalışanların en az çözülen bir problemi denemek ve kendi değerlendirmesi yapmak üzere bir çözümleme aşamasından oluşur; bu aşama ise başvuruları birleştirerek her problem için nihai başvuru seçer. Qwen3'ün varsayılan örnekleme parametrelerini kullandık ve sistem isteği yoktu.

Modelimizi burada açık kaynaklı sunuyoruz ve mantık oluşturduğumuzu burada sunuyoruz.
Bu model, @theemozilla ve @dmayhem93 tarafından inşa edilen altyapı üzerine @rogershijin tarafından @nullvaluetensor ve @teknium ve @theemozilla liderliğiyle eğitilmiştir.
118,09K
En İyiler
Sıralama
Takip Listesi

