Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tänään avaamme Nomos 1:n lähdekoodin. Vain 30B-parametreillaan se saa tämän vuoden Putnamissa, yhdessä maailman arvostetuimmista matematiikkakilpailuista, 87/120.
Tämä pistemäärä sijoittuisi vuonna 2024 sijalle #2/3988 ja merkitsee ensimmäistä askeltamme @hillclimbai kohti SOTA-tekoälymatemaatikon luomista.

Nomos 1 saavutti 87/120 ja 8 täydellistä tulosta, kun taas Qwen3-30ba3b-Thinking-2507 sai 24/120 samassa valjaissa samoissa olosuhteissa, mikä viittaa siihen, että suorituskyky johtuu pitkälti harjoittelun jälkeisestä ja datan laadusta, ei valjaista.

Lähetykset arvioitiin sokkona ihmisen Putnam top 200 -kilpailijan toimesta, jolle annettiin anonymisoidut lähetykset.
Tarkat tiedostot, jotka lähetetään ihmisannotaattoreillemme arviointia varten, ovat saatavilla täällä anonymisoituina: , yhdessä niiden luomiseen käytettyjen runbookien kanssa
Käytimme samoja aikarajoja kuin kilpailijat – 3 tuntia kummallakin osalla.
Avoimen lähdekoodin päättelyjärjestelmämme koostuu ratkaisuvaiheesta, jossa työntekijät yrittävät vähiten ratkaistun ongelman ja arvioivat sen itse, jota seuraa viimeistelyvaihe, jossa lähetykset yhdistetään ja valitaan lopullinen ehdotus jokaiselle ongelmalle. Käytimme Qwen3:n oletusnäytteenottoparametreja emmekä käyttäneet järjestelmäkehotusta.

Me avaamme mallimme täällä ja päättelyjärjestelmämme täällä.
Tätä mallia kouluttaa @rogershijin @theemozilla ja @dmayhem93 rakentamalla infrastruktuurilla @nullvaluetensor ja johdolla @teknium ja @theemozilla.
118,11K
Johtavat
Rankkaus
Suosikit

