Zichtbare verbetering! Qwen3-Max officiële versie vs Preview versie praktische test! Het is nu 3 maanden geleden sinds de release van de Qwen3-Max-ThinkingPreview versie, en de officiële versie is eindelijk hier! Hoe groot is de verbetering deze keer? Hier zijn de testresultaten! Programmeervermogenstest: De vuurwerkkettingexplosietest heeft een epische verbetering laten zien, de vorige Preview versie kon helemaal geen kettingreactie veroorzaken, nu kan het niet alleen kettingreacties veroorzaken, maar de resultaten zijn ook behoorlijk goed; de olifantenpasta-test heeft duidelijke verbeteringen in de modellering van de kegelvormige fles, er is zelfs een vloeistofdalinganimatie, maar de deeltjesanimatie heeft nog steeds enkele problemen; de tourbillon-movement is van niet kunnen voltooien naar succesvol modelleren gegaan; de deeltjeselasticiteit en botsingsdetectie van de Python-kopjes die water gieten zijn allemaal opgelost. Deze keer is er een esthetische test toegevoegd: met tekstbeschrijvingen laten we het p5.js moderne kunstwerken reproduceren, het resultaat is acceptabel, maar het ruimtelijk begrip blijft een probleem, de horizontale lijn in het kleine venster is niet goed uitgelijnd. Agent-vermogenstest: Uitstekende prestaties binnen 60K context, naar schatting kan het 500 punten SOTA-niveau bereiken, maar boven de 60K daalt de prestatie dramatisch, wat leidt tot taakcycli of het vergeten van tools. De terugroepcapaciteit ligt dicht bij 70%, maar er is een vreemde verschijnsel opgetreden - hoe korter de context, hoe slechter de terugroepcapaciteit, het is momenteel onduidelijk wat het probleem is, ik heb het al aan de officiële instantie gerapporteerd. Samenvatting: De officiële versie heeft een zichtbare verbetering ten opzichte van de Preview versie, zowel in programmeren als in esthetiek, maar het ruimtelijk begrip, de agentcapaciteit en de terugroepcapaciteit bij lange contexten moeten nog verder worden verfijnd. Bovendien is deze test uitgevoerd met de normale thinking versie, en die TTS-modus met de extreem hoge score is momenteel nog niet gelanceerd! Ik kijk ernaar uit!