Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Оновлення таблиці лідерів GDPval-AA: GLM-4.7 став новим лідером відкритих ваг з ELO 1224, а MiniMax M2.1 суттєво покращує порівняно з M2
GDPval-AA порівнює результати моделей для реалістичних завдань роботи з знаннями, таких як підготовка презентацій, аналіз та інше, використовуючи спеціалізоване термінальне середовище та доступ до вебу. Результати роботи потім порівнюються між собою та оцінюються за допомогою автоматизованого конвеєра для генерації відповідей і оцінок ELO.
➤ GLM-4.7 з @Zai_org досягає ELO 1224, що трохи позаду GPT-5.1 (високий) і має приріст на ~170 пунктів порівняно з GLM-4.6. Це означає, що ми очікуємо, що вихідні дані GLM-4.7 перевищуватимуть GLM-4.6 у 73% випадків у порівнянні з головою.
➤ @MiniMax__AI також показали покращення порівняно з GDPval-AA з випуском M2.1, збільшивши ELO на +56 пунктів порівняно з попередньою моделлю M2, але все ще перебуваючи між GLM-4.6 і GPT-5.1 Codex (високий).

Таблиця лідерів GDPval-AA:
Порівняння безсерверних API GLM-4.7 за допомогою штучного аналізу:
Порівняння серверних API MiniMax M2.1 за допомогою штучного аналізу:
2,82K
Найкращі
Рейтинг
Вибране
