Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 đã đến — nó thực sự tốt đến mức nào?
Một bài đánh giá được đọc rộng rãi từ người đóng góp Zhihu toyama nao cung cấp những phân tích rõ ràng.
Baidu đã theo sau OpenAI từ 3-6 tháng với các phiên bản phát hành tương ứng. Sau GPT-5, ERNIE 5.0 đã đến đúng thời điểm — và không giống như phiên bản 4.5 vội vàng, nó cuối cùng trông giống như một mô hình nội địa hàng đầu vững chắc.
Hiệu suất tăng khoảng 80% so với X1.1, gần như tương đương với MiniMax M2. Dữ liệu huấn luyện dường như đã được xây dựng lại: đầu ra sạch hơn và mạch lạc hơn nhiều (Hình 1).
👇 Đây là so sánh tinh gọn:
✅ Nơi ERNIE 5.0 Cải Thiện
• Theo dõi hướng dẫn: Điểm số cao và thậm chí đạt đỉnh hàng đầu — nhưng với những thất bại kỳ lạ ở đầu thấp (ví dụ, định dạng ngày tháng không nhất quán giữa các lần thử).
• Tính toán cơ bản: Đáng tin cậy cho toán học cấp K12; ổn định hơn X1.1, mặc dù vẫn yếu hơn M2 trong các nhiệm vụ phức tạp.
• Đầu ra sạch hơn nhiều: X1.1 gặp phải dữ liệu tinh chế ồn ào và bản dịch vụng về. ERNIE 5.0 phần lớn khắc phục điều này: chuỗi suy nghĩ rõ ràng hơn, câu trả lời cuối cùng sạch hơn, dễ đọc hơn.
🙋 Nơi Nó Vẫn Gặp Khó Khăn
• Tỷ lệ ảo giác cao: Quá nhiều câu trả lời tự tin nhưng sai về việc phục hồi ký hiệu toán học, xáo trộn ký tự và các nhiệm vụ ngữ cảnh dài — gần hơn với hiệu suất lý luận cấp hai.
• Thiếu sự sâu sắc: Thất bại trong việc phát hiện các mẫu cơ bản (#46 mẫu chữ cái, #32 lý luận lịch), thường sử dụng brute-force thay vì trừu tượng hóa.
• Thỉnh thoảng gặp vòng lặp vô hạn: Hiếm (<3%) nhưng gây ngạc nhiên, vì chúng đã biến mất trong các mô hình nội địa gần đây.
• Khả năng đa vòng yếu: Thường quên quy tắc hoặc các vòng trước trước vòng 7; các vòng lặp được kích hoạt dễ dàng hơn.
💬 Đánh Giá
Kỷ nguyên một triệu tham số của Trung Quốc mới chỉ được 3 tháng, và Baidu đã nhảy lên mô hình 2T.
Tuy nhiên, so với Kimi K2 Thinking, ERNIE 5.0 cảm thấy hơi "phình" — lớn, có khả năng, nhưng không hoàn toàn sử dụng hết trọng lượng của nó.
Dù sao, đây có thể là tín hiệu trở lại mà @Baidu_Inc đã chờ đợi từ lâu — một lời nhắc nhở rằng Baidu có ý định ở lại trong cuộc đua LLM.
📖 Đánh giá đầy đủ:
🔗 Tham khảo:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Hàng đầu
Thứ hạng
Yêu thích

