Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Peningkatannya jelas! Qwen3-Max Versi Resmi vs Tes Versi Pratinjau!
Sudah 3 bulan sejak rilis Qwen3-Max-ThinkingPreview, dan versi resminya akhirnya hadir! Seberapa besar dorongan ini? Berikan Anda hasil tes secara langsung!
Tes kemampuan pemrograman: Peningkatan epik uji ledakan rantai petasan, versi pratinjau sebelumnya tidak dapat dirantai sama sekali, sekarang tidak hanya dapat dirantai, efeknya cukup bagus; Pemodelan uji labu berbentuk kerucut pasta gigi gajah telah meningkat secara signifikan, dan bahkan ada animasi penurunan cair, tetapi masih ada beberapa masalah dengan animasi partikel. Gerakan tourbillon berubah dari belum selesai menjadi dimodelkan dengan lancar; Elastisitas partikel dan deteksi tabrakan cangkir Python yang menuangkan air telah diperbaiki.
Kali ini, tes estetika telah ditambahkan: penggunaan deskripsi teks untuk mengembalikan karya seni modern p5.js, efeknya baik-baik saja, tetapi kemampuan pemahaman spasial masih tertunda, dan garis horizontal jendela kecil tidak sejajar.
Tes kemampuan agen: Kinerja luar biasa dalam konteks 60K, diperkirakan mencapai level SOTA 500 poin, tetapi setelah 60K, kinerjanya turun tajam dan akan ada masalah dengan perulangan tugas atau alat lupa.
Kapasitas penarikan mendekati 70%, tetapi ada fenomena aneh - semakin pendek konteksnya, semakin buruk penarikannya, tidak jelas apa masalahnya, saya telah melaporkannya kepada pejabat.
Ringkasan: Versi resmi terlihat dengan mata telanjang dibandingkan dengan versi pratinjau, dan pemrograman serta estetika telah ditingkatkan, tetapi pemahaman spasial, kemampuan agen, dan ingatan konteks yang panjang masih perlu dipoles. Selain itu, tes ini adalah versi berpikir normal, dan mode TTS dengan skor super tinggi belum online! Menantikan gelombang!
#Qwen3Max #Qwen3MaxThinking #KCORES大模型竞技场 #AI编程 #大模型测评 #阿里千问
Teratas
Peringkat
Favorit
