Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 вже тут — наскільки він хороший насправді?
Широко читаний відгук від дописувача Zhihu тояма нао пропонує чіткі розбивки.
Baidu відстає від OpenAI на 3-6 місяців завдяки релізам, що відповідають версіям. Після GPT-5 ERNIE 5.0 з'явився за сигналом — і на відміну від поспішаючого 4.5, він нарешті виглядає добротною вітчизняною моделлю першого ешелону.
Продуктивність підскакує на ~80% порівняно з X1.1, що приблизно відповідає MiniMax M2. Тренувальні дані здаються перебудованими: виходи набагато чистіші та зв'язніші (рис. 1).
👇 Ось дистильоване порівняння:
✅Де ERNIE 5.0 стає кращим
• Слідування інструкціям: Високі бали і навіть піки найвищого рівня — але з дивними помилками низького рівня (наприклад, непослідовні формати дат на проходах).
• Базові обчислення: надійні для математики рівня K12; стабільніший, ніж X1.1, але все ж таки слабший за M2 у складних завданнях.
• Набагато чистіший вивід: X1.1 страждав від зашумлених дистильованих даних і незручних перекладів. ERNIE 5.0 багато в чому це виправляє: чіткіші ланцюжки думок, чистіші кінцеві відповіді, краща читабельність.
🙋 Де вона все ще бореться
• Високий рівень галюцинацій: занадто багато впевнених, але неправильних відповідей на тему відновлення математичних символів, скремблювання персонажів і завдань з довгим контекстом — ближче до продуктивності міркувань другого рівня.
• Низька проникливість: не помічає прихованих закономірностей (шаблон #46 букв, #32 календарне міркування), часто грубий вплив замість абстрагування.
• Випадкові нескінченні петлі: рідкісні (<3%), але дивовижні, враховуючи, що вони зникли в останніх вітчизняних моделях.
• Слабка здатність до кількох ходів: часто забуває правила або попередні ходи перед 7 раундом; петлі спрацьовують легше.
💬Висновки
Ери трильйонів параметрів у Китаї ледве виповнилося 3 місяці, а Baidu вже перейшла на модель 2T.
Проте, у порівнянні з Kimi K2 Thinking, ERNIE 5.0 здається трохи «пухким» — великим, здатним, але не повністю використовує свою вагу.
Тим не менш, це може бути довгоочікуваним сигналом про повернення @Baidu_Inc — нагадуванням про те, що Baidu має намір залишитися в гонці LLM.
📖 Повна оцінка:
🔗 Еталоном:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Найкращі
Рейтинг
Вибране

