Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vandaag maken we Nomos 1 open source. Met slechts 30B parameters scoort het 87/120 op dit jaar’s Putnam, een van de meest prestigieuze wiskundewedstrijden ter wereld.
Deze score zou #2/3988 in 2024 zijn en markeert onze eerste stap met @hillclimbai richting het creëren van een SOTA AI wiskundige.

Nomos 1 behaalde een 87/120 met 8 perfecte scores, terwijl Qwen3-30ba3b-Thinking-2507 24/120 scoorde toen het in dezelfde harnas onder dezelfde omstandigheden werd uitgevoerd, wat aangeeft dat de prestaties grotendeels te danken zijn aan post-training en datakwaliteit in plaats van de harnas.

Inzendingen werden blind beoordeeld door een menselijke Putnam top 200 deelnemer die geanonimiseerde inzendingen ontving.
De exacte bestanden die naar onze menselijke annotatoren voor beoordeling zijn gestuurd, zijn hier beschikbaar in gedemystificeerde vorm: , samen met de handleidingen die zijn gebruikt om ze te genereren.
We hebben dezelfde tijdslimieten gebruikt als de deelnemers - 3 uur voor elk van de twee delen.
Ons open source redeneersysteem bestaat uit een oplossingsfase, waarin werknemers een het minst opgeloste probleem proberen en zichzelf beoordelen, gevolgd door een finalisatiefase, die inzendingen consolideert om een definitieve inzending voor elk probleem te kiezen. We hebben de standaard steekproefparameters van Qwen3 gebruikt en geen systeemprompt.

We open-source ons model hier en onze redenering hier.
Dit model is getraind door @rogershijin op infrastructuur gebouwd door @theemozilla en @dmayhem93 met advies van @nullvaluetensor en leiding van @teknium en @theemozilla.
118,1K
Boven
Positie
Favorieten

