🤔 Baidu ERNIE 5.0 ada di sini — seberapa bagus sebenarnya? Ulasan yang banyak dibaca dari kontributor Zhihu toyama nao menawarkan rincian yang jelas. Baidu telah membuntuti OpenAI selama 3-6 bulan dengan rilis yang cocok dengan versi. Setelah GPT-5, ERNIE 5.0 tiba tepat pada isyarat — dan tidak seperti 4.5 yang terburu-buru, akhirnya terlihat seperti model domestik lapis pertama yang solid. Performa melonjak ~80% dibandingkan X1.1, kira-kira menyamai MiniMax M2. Data pelatihan tampaknya dibangun kembali: output jauh lebih bersih dan lebih koheren (Gambar 1). 👇 Berikut perbandingan sulingannya: ✅Di mana ERNIE 5.0 Menjadi Lebih Baik • Instruksi berikut: Skor tinggi dan bahkan puncak tingkat atas — tetapi dengan kegagalan kelas bawah yang aneh (misalnya, format tanggal yang tidak konsisten di seluruh lintasan). • Komputasi dasar: Dapat diandalkan untuk matematika tingkat K12; lebih stabil dari X1.1, meskipun masih lebih lemah dari M2 pada tugas-tugas yang kompleks. • Output yang jauh lebih bersih: X1.1 menderita data suling yang bising dan terjemahan yang canggung. ERNIE 5.0 sebagian besar memperbaiki ini: rantai pemikiran yang lebih jelas, jawaban akhir yang lebih bersih, keterbacaan yang lebih baik. 🙋 Di Mana Masih Berjuang • Tingkat halusinasi tinggi: Terlalu banyak jawaban percaya diri tetapi salah tentang pemulihan simbol matematika, pengacak karakter, dan tugas konteks panjang — lebih dekat dengan kinerja penalaran tingkat kedua. • Wawasan rendah: Gagal menemukan pola yang mendasari (pola huruf # 46, penalaran kalendar # 32), seringkali memaksa kasar alih-alih mengabstraksi. • Loop tak terbatas sesekali: Langka (<3%) tetapi mengejutkan, mengingat mereka telah menghilang dalam model domestik baru-baru ini. • Kemampuan multi-giliran yang lemah: Sering melupakan aturan atau giliran sebelumnya sebelum putaran 7; loop dipicu lebih mudah. 💬Putusan Era triliunan parameter China baru berusia 3 bulan, dan Baidu sudah melompat ke model 2T. Namun dibandingkan dengan Kimi K2 Thinking, ERNIE 5.0 terasa sedikit "bengkak" — besar, mampu, tetapi tidak sepenuhnya menggunakan bobotnya. Namun, ini mungkin sinyal comeback @Baidu_Inc yang telah lama ditunggu-tunggu - pengingat bahwa Baidu berniat untuk tetap dalam perlombaan LLM. 📖 Evaluasi lengkap: 🔗 Patokan: #ERNIE5 #Baidu #AI #LLM #ChinaAI