I dag åpner vi Nomos 1 som åpen kildekode. Med bare 30 milliarder poeng scorer den 87/120 på årets Putnam, en av verdens mest prestisjefylte matematikkonkurranser. Denne poengsummen vil rangere #2/3988 i 2024 og markerer vårt første steg med @hillclimbai mot å skape en SOTA AI-matematiker.
Nomos 1 oppnådde 87/120 med 8 perfekte poengsummer, mens Qwen3-30ba3b-Thinking-2507 fikk 24/120 når den ble brukt i samme sele under samme forhold, noe som indikerer at ytelsen i stor grad skyldes ettertrening og datakvalitet snarere enn selen.
Innsendte bidrag ble blindvurdert av en menneskelig Putnam topp 200-deltaker som fikk anonymiserte bidrag. De eksakte filene som sendes til våre menneskelige annotatører for vurdering er tilgjengelige her deanonymisert: , sammen med runbooks som ble brukt til å generere dem Vi brukte samme tidsbegrensninger som konkurrentene – 3 timer for hver av de to delene.
Vårt åpne kildekode-resonnementssystem består av en løsningsfase, hvor arbeiderne forsøker å finne et minst løst problem og vurdere seg selv, etterfulgt av en finaliseringsfase som samler innsendelser for å velge en endelig innsending for hvert problem. Vi brukte Qwen3s standard prøvetakingsparametere og ingen systemprompt.
Vi åpner vår modell her og vårt resonnementverktøy her. Denne modellen ble trent av @rogershijin på infrastruktur bygget av @theemozilla og @dmayhem93 med råd fra @nullvaluetensor og ledelse fra @teknium og @theemozilla.
88,46K