Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
I dag åpner vi Nomos 1 som åpen kildekode. Med bare 30 milliarder poeng scorer den 87/120 på årets Putnam, en av verdens mest prestisjefylte matematikkonkurranser.
Denne poengsummen vil rangere #2/3988 i 2024 og markerer vårt første steg med @hillclimbai mot å skape en SOTA AI-matematiker.

Nomos 1 oppnådde 87/120 med 8 perfekte poengsummer, mens Qwen3-30ba3b-Thinking-2507 fikk 24/120 når den ble brukt i samme sele under samme forhold, noe som indikerer at ytelsen i stor grad skyldes ettertrening og datakvalitet snarere enn selen.

Innsendte bidrag ble blindvurdert av en menneskelig Putnam topp 200-deltaker som fikk anonymiserte bidrag.
De eksakte filene som sendes til våre menneskelige annotatører for vurdering er tilgjengelige her deanonymisert: , sammen med runbooks som ble brukt til å generere dem
Vi brukte samme tidsbegrensninger som konkurrentene – 3 timer for hver av de to delene.
Vårt åpne kildekode-resonnementssystem består av en løsningsfase, hvor arbeiderne forsøker å finne et minst løst problem og vurdere seg selv, etterfulgt av en finaliseringsfase som samler innsendelser for å velge en endelig innsending for hvert problem. Vi brukte Qwen3s standard prøvetakingsparametere og ingen systemprompt.

Vi åpner vår modell her og vårt resonnementverktøy her.
Denne modellen ble trent av @rogershijin på infrastruktur bygget av @theemozilla og @dmayhem93 med råd fra @nullvaluetensor og ledelse fra @teknium og @theemozilla.
88,46K
Topp
Rangering
Favoritter

