Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 ada di sini — seberapa bagus sebenarnya?
Ulasan yang banyak dibaca dari kontributor Zhihu toyama nao menawarkan rincian yang jelas.
Baidu telah membuntuti OpenAI selama 3-6 bulan dengan rilis yang cocok dengan versi. Setelah GPT-5, ERNIE 5.0 tiba tepat pada isyarat — dan tidak seperti 4.5 yang terburu-buru, akhirnya terlihat seperti model domestik lapis pertama yang solid.
Performa melonjak ~80% dibandingkan X1.1, kira-kira menyamai MiniMax M2. Data pelatihan tampaknya dibangun kembali: output jauh lebih bersih dan lebih koheren (Gambar 1).
👇 Berikut perbandingan sulingannya:
✅Di mana ERNIE 5.0 Menjadi Lebih Baik
• Instruksi berikut: Skor tinggi dan bahkan puncak tingkat atas — tetapi dengan kegagalan kelas bawah yang aneh (misalnya, format tanggal yang tidak konsisten di seluruh lintasan).
• Komputasi dasar: Dapat diandalkan untuk matematika tingkat K12; lebih stabil dari X1.1, meskipun masih lebih lemah dari M2 pada tugas-tugas yang kompleks.
• Output yang jauh lebih bersih: X1.1 menderita data suling yang bising dan terjemahan yang canggung. ERNIE 5.0 sebagian besar memperbaiki ini: rantai pemikiran yang lebih jelas, jawaban akhir yang lebih bersih, keterbacaan yang lebih baik.
🙋 Di Mana Masih Berjuang
• Tingkat halusinasi tinggi: Terlalu banyak jawaban percaya diri tetapi salah tentang pemulihan simbol matematika, pengacak karakter, dan tugas konteks panjang — lebih dekat dengan kinerja penalaran tingkat kedua.
• Wawasan rendah: Gagal menemukan pola yang mendasari (pola huruf # 46, penalaran kalendar # 32), seringkali memaksa kasar alih-alih mengabstraksi.
• Loop tak terbatas sesekali: Langka (<3%) tetapi mengejutkan, mengingat mereka telah menghilang dalam model domestik baru-baru ini.
• Kemampuan multi-giliran yang lemah: Sering melupakan aturan atau giliran sebelumnya sebelum putaran 7; loop dipicu lebih mudah.
💬Putusan
Era triliunan parameter China baru berusia 3 bulan, dan Baidu sudah melompat ke model 2T.
Namun dibandingkan dengan Kimi K2 Thinking, ERNIE 5.0 terasa sedikit "bengkak" — besar, mampu, tetapi tidak sepenuhnya menggunakan bobotnya.
Namun, ini mungkin sinyal comeback @Baidu_Inc yang telah lama ditunggu-tunggu - pengingat bahwa Baidu berniat untuk tetap dalam perlombaan LLM.
📖 Evaluasi lengkap:
🔗 Patokan:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Teratas
Peringkat
Favorit

