Jeg hørte at forsterkende læring bare fungerer med verifiserbare belønninger? 😛 Congrats!!
Alexander Wei
Alexander Wei19. juli, 15:50
1/N Jeg er glad for å dele at vår siste @OpenAI eksperimentelle resonnement LLM har oppnådd en langvarig stor utfordring innen AI: gullmedaljenivå på verdens mest prestisjefylte matematikkkonkurranse – International Math Olympiad (IMO).
31,21K