GDPval-AA Ranglisten-Update: GLM-4.7 ist der neue Führer mit offenen Gewichten mit einem ELO von 1224, und MiniMax M2.1 macht bedeutende Verbesserungen gegenüber M2 GDPval-AA vergleicht die Ausgaben von Modellen bei realistischen Wissensarbeit-Aufgaben wie der Erstellung von Präsentationen, Analysen und mehr, unter Verwendung einer speziellen Terminalumgebung und Webzugang. Die Arbeitsergebnisse werden dann miteinander verglichen und mit einer automatisierten Pipeline bewertet, um Übereinstimmungen und ELO-Punkte zu generieren. ➤ GLM-4.7 von @Zai_org erreicht ein ELO von 1224, was nur hinter GPT-5.1 (hoch) liegt, und einem Anstieg von ~170 Punkten im Vergleich zu GLM-4.6. Das bedeutet, dass wir erwarten, dass die Ausgaben von GLM-4.7 GLM-4.6 in 73% der Fälle schlagen, wenn sie direkt verglichen werden. ➤ @MiniMax__AI zeigte ebenfalls Verbesserungen bei GDPval-AA mit ihrer Veröffentlichung von M2.1, wobei das ELO um +56 Punkte im Vergleich zum vorherigen M2-Modell erhöht wurde, aber immer noch zwischen GLM-4.6 und GPT-5.1 Codex (hoch) sitzt.
BIP-Wert-AA Rangliste: Künstliche Analyse des Vergleichs von GLM-4.7 serverlosen API-Anbietern: Künstliche Analyse des Vergleichs von MiniMax M2.1 serverlosen API-Anbietern:
2,89K