Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 ist da – wie gut ist es wirklich?
Eine weit verbreitete Rezension des Zhihu-Mitglieds toyama nao bietet klare Aufschlüsselungen.
Baidu hat OpenAI mit versionengemäßen Veröffentlichungen um 3-6 Monate hinterhergehinkt. Nach GPT-5 kam ERNIE 5.0 pünktlich – und im Gegensatz zum hastigen 4.5 sieht es endlich nach einem soliden erstklassigen inländischen Modell aus.
Die Leistung springt um ~80% im Vergleich zu X1.1 und entspricht grob MiniMax M2. Die Trainingsdaten scheinen neu aufgebaut: Die Ausgaben sind viel sauberer und kohärenter (Abb. 1).
👇 Hier ist der destillierte Vergleich:
✅ Wo ERNIE 5.0 besser wird
• Befolgung von Anweisungen: Hohe Punktzahlen und sogar erstklassige Spitzen – aber mit seltsamen Fehlern im unteren Bereich (z. B. inkonsistente Datumsformate über Durchgänge hinweg).
• Grundlegende Berechnungen: Zuverlässig für Mathematik auf K12-Niveau; stabiler als X1.1, obwohl immer noch schwächer als M2 bei komplexen Aufgaben.
• Viel sauberere Ausgaben: X1.1 litt unter rauschhaften destillierten Daten und ungeschickten Übersetzungen. ERNIE 5.0 behebt dies weitgehend: klarere Gedankengänge, sauberere Endantworten, bessere Lesbarkeit.
🙋 Wo es immer noch Schwierigkeiten hat
• Hohe Halluzinationsrate: Zu viele selbstbewusste, aber falsche Antworten bei der Wiederherstellung von mathematischen Symbolen, Zeichenverwirrung und Aufgaben mit langem Kontext – näher an der Leistung von zweitklassigem Denken.
• Geringe Einsicht: Versäumt es, zugrunde liegende Muster zu erkennen (#46 Buchstabenmuster, #32 kalenderbezogenes Denken), oft wird mit Gewalt gearbeitet, anstatt zu abstrahieren.
• Gelegentliche unendliche Schleifen: Selten (<3%), aber überraschend, da sie in den letzten inländischen Modellen verschwunden waren.
• Schwache Fähigkeit zu Mehrfachrunden: Vergisst oft Regeln oder vorherige Runden vor Runde 7; Schleifen werden leichter ausgelöst.
💬 Das Urteil
Chinas Billionen-Parameter-Ära ist erst seit 3 Monaten im Gange, und Baidu ist bereits auf ein 2T-Modell gesprungen.
Doch im Vergleich zu Kimi K2 Thinking fühlt sich ERNIE 5.0 ein wenig "aufgebläht" an – groß, fähig, aber nutzt sein Gewicht nicht vollständig aus.
Dennoch könnte dies das lang erwartete Comeback-Signal von @Baidu_Inc sein – eine Erinnerung daran, dass Baidu beabsichtigt, im LLM-Rennen zu bleiben.
📖 Vollständige Bewertung:
🔗 Benchmark:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Top
Ranking
Favoriten

