Minusta on hauskaa, miten DeepSeekin tutkimusta enimmäkseen sivuutetaan huomiotta. He raahasivat teollisuuden, potkien ja huutaen, tehokkaiden MoE:iden ja tehokkaan RL:n maailmaan, mutta siinä kaikki. Miksi kaikki tarkkaavaisuus ei ole vielä ohjeistanut DSA:ta? Ovatko Math-V2-menetelmät käytössä? Ei. «Anna minulle valaspainoja»
Ahmad
Ahmad10.1. klo 11.53
Ole hyvä ja pudota se V4 pian, Whale
(Tietenkin haluan myös V4:n)
207