Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Оновлення таблиці лідерів GDPval-AA: GLM-4.7 став новим лідером відкритих ваг з ELO 1224, а MiniMax M2.1 суттєво покращує порівняно з M2 GDPval-AA порівнює результати моделей для реалістичних завдань роботи з знаннями, таких як підготовка презентацій, аналіз та інше, використовуючи спеціалізоване термінальне середовище та доступ до вебу. Результати роботи потім порівнюються між собою та оцінюються за допомогою автоматизованого конвеєра для генерації відповідей і оцінок ELO. ➤ GLM-4.7 з @Zai_org досягає ELO 1224, що трохи позаду GPT-5.1 (високий) і має приріст на ~170 пунктів порівняно з GLM-4.6. Це означає, що ми очікуємо, що вихідні дані GLM-4.7 перевищуватимуть GLM-4.6 у 73% випадків у порівнянні з головою. ➤ @MiniMax__AI також показали покращення порівняно з GDPval-AA з випуском M2.1, збільшивши ELO на +56 пунктів порівняно з попередньою моделлю M2, але все ще перебуваючи між GLM-4.6 і GPT-5.1 Codex (високий).

Таблиця лідерів GDPval-AA: Порівняння безсерверних API GLM-4.7 за допомогою штучного аналізу: Порівняння серверних API MiniMax M2.1 за допомогою штучного аналізу:

2,82K

Найкращі

Рейтинг

Вибране