Jeg synes det er morsomt hvordan DeepSeeks forskning stort sett blir ignorert. De dro bransjen, sparkende og skrikende, inn i en verden av effektive MoEs og effektiv RL, men det er alt. Hvorfor er ikke alle Instructs DSA med full oppmerksomhet ennå? Er Math-V2-metodene tatt i bruk? Nei. «Gi meg hvalvekter»
Ahmad
Ahmad10. jan., 11:53
Vær så snill, slipp den V4 snart, hval.
(Selvfølgelig vil jeg også ha V4)
223