🤔 Baidu ERNIE 5.0 ist da – wie gut ist es wirklich? Eine weit verbreitete Rezension des Zhihu-Mitglieds toyama nao bietet klare Aufschlüsselungen. Baidu hat OpenAI mit versionengemäßen Veröffentlichungen um 3-6 Monate hinterhergehinkt. Nach GPT-5 kam ERNIE 5.0 pünktlich – und im Gegensatz zum hastigen 4.5 sieht es endlich nach einem soliden erstklassigen inländischen Modell aus. Die Leistung springt um ~80% im Vergleich zu X1.1 und entspricht grob MiniMax M2. Die Trainingsdaten scheinen neu aufgebaut: Die Ausgaben sind viel sauberer und kohärenter (Abb. 1). 👇 Hier ist der destillierte Vergleich: ✅ Wo ERNIE 5.0 besser wird • Befolgung von Anweisungen: Hohe Punktzahlen und sogar erstklassige Spitzen – aber mit seltsamen Fehlern im unteren Bereich (z. B. inkonsistente Datumsformate über Durchgänge hinweg). • Grundlegende Berechnungen: Zuverlässig für Mathematik auf K12-Niveau; stabiler als X1.1, obwohl immer noch schwächer als M2 bei komplexen Aufgaben. • Viel sauberere Ausgaben: X1.1 litt unter rauschhaften destillierten Daten und ungeschickten Übersetzungen. ERNIE 5.0 behebt dies weitgehend: klarere Gedankengänge, sauberere Endantworten, bessere Lesbarkeit. 🙋 Wo es immer noch Schwierigkeiten hat • Hohe Halluzinationsrate: Zu viele selbstbewusste, aber falsche Antworten bei der Wiederherstellung von mathematischen Symbolen, Zeichenverwirrung und Aufgaben mit langem Kontext – näher an der Leistung von zweitklassigem Denken. • Geringe Einsicht: Versäumt es, zugrunde liegende Muster zu erkennen (#46 Buchstabenmuster, #32 kalenderbezogenes Denken), oft wird mit Gewalt gearbeitet, anstatt zu abstrahieren. • Gelegentliche unendliche Schleifen: Selten (<3%), aber überraschend, da sie in den letzten inländischen Modellen verschwunden waren. • Schwache Fähigkeit zu Mehrfachrunden: Vergisst oft Regeln oder vorherige Runden vor Runde 7; Schleifen werden leichter ausgelöst. 💬 Das Urteil Chinas Billionen-Parameter-Ära ist erst seit 3 Monaten im Gange, und Baidu ist bereits auf ein 2T-Modell gesprungen. Doch im Vergleich zu Kimi K2 Thinking fühlt sich ERNIE 5.0 ein wenig "aufgebläht" an – groß, fähig, aber nutzt sein Gewicht nicht vollständig aus. Dennoch könnte dies das lang erwartete Comeback-Signal von @Baidu_Inc sein – eine Erinnerung daran, dass Baidu beabsichtigt, im LLM-Rennen zu bleiben. 📖 Vollständige Bewertung: 🔗 Benchmark: #ERNIE5 #Baidu #AI #LLM #ChinaAI