Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Parannus on ilmeinen! Qwen3-Maxin virallinen versio vs esikatseluversio testi!
Qwen3-Max-ThinkingPreview'n julkaisusta on kulunut kolme kuukautta, ja virallinen versio on vihdoin täällä! Kuinka suuri tämä boosti on? Annan sinulle testitulokset suoraan!
Ohjelmointikykytesti: Ilotulitusketjun räjähdystesti – eeppinen parannus, aiempaa esikatseluversiota ei voitu ketjuttaa lainkaan, nyt sitä ei voi vain ketjuttaa, vaan vaikutus on varsin hyvä; Elefanttihammastahnan kartiomaisen pullotestin mallinnus on parantunut merkittävästi, ja mukana on jopa nestemäinen laskeutumisanimaatio, mutta hiukkasanimaatiossa on edelleen joitakin ongelmia. Tourbillon-koneisto muuttui keskeneräisestä sujuvaksi mallinnetuksi; Python-kupin veden kaatamisen hiukkasten joustavuus ja törmäystunnistus on kiinteä.
Tällä kertaa on lisätty esteettinen testi: tekstikuvausten käyttö modernien taideteosten p5.js palauttamiseksi, vaikutus on ihan ok, mutta tilallisen ymmärtämisen kyky on edelleen viivästynyt ja pienen ikkunan vaakasuorat linjat ovat epätasaisia.
Agentin kykytesti: Erinomainen suorituskyky 60K-kontekstissa, arvioitu nousevan 500 pisteeseen SOTA-tasolla, mutta 60K:n jälkeen suorituskyky laskee jyrkästi, ja tehtäviä silmukassa tai työkalujen unohtamisessa ilmenee ongelmia.
Takaisinkutsukapasiteetti on lähellä 70 %, mutta on olemassa outo ilmiö – mitä lyhyempi konteksti, sitä pahempi takaisinkutsu, ei ole selvää, mikä ongelma on, olen ilmoittanut siitä viranomaisille.
Yhteenveto: Virallinen versio näkyy paljain silmin verrattuna esikatseluversioon, ja ohjelmointi sekä estetiikka ovat parantuneet, mutta tilallinen ymmärrys, agenttikyky ja pitkä kontekstin muistaminen vaativat vielä hiomista. Lisäksi tämä testi on normaaliajatteluversio, ja TTS-tila, jossa on todella korkea pistemäärä, ei ole vielä verkossa! Odotan innolla aaltoa!
#Qwen3Max #Qwen3MaxThinking #KCORES大模型竞技场 #AI编程 #大模型测评 #阿里千问
Johtavat
Rankkaus
Suosikit
