Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Artificial Analysis

Незалежний аналіз моделей штучного інтелекту та хостинг-провайдерів - виберіть найкращу модель та API провайдера для вашого випадку використання

DeepSeek запускає версію 3.1, об'єднуючи V3 і R1 у гібридну модель міркувань з поступовим зростанням інтелекту Поступове збільшення інтелекту: Початкові результати порівняльного аналізу для DeepSeek V3.1 показують, що індекс інтелекту штучного аналізу становить 60 балів у режимі міркувань, порівняно з результатом R1 у 59 балів. У режимі без міркувань V3.1 досягає 49 балів, що є більшим збільшенням порівняно з попереднім результатом V3 0324 у 44 балах. Це залишає V3.1 (міркування) позаду останнього Qwen3 235B 2507 від Alibaba (міркування) - DeepSeek не повернув собі лідерство. Гібридне міркування: @deepseek_ai вперше перейшов до гібридної моделі міркування, підтримуючи як режими міркування, так і способи неміркування. Перехід DeepSeek до єдиної гібридної моделі міркувань імітує підхід, прийнятий OpenAI, Anthropic і Google. Цікаво, однак, відзначити, що Alibaba нещодавно відмовилася від свого гібридного підходу, якому вони віддали перевагу для Qwen3, випустивши окремі випуски моделей міркувань та інструкцій Qwen3 2507. Виклик функцій / використання інструменту: У той час як DeepSeek заявляє про покращений виклик функцій для моделі, DeepSeek V3.1 не підтримує виклик функцій у режимі міркування. Це, ймовірно, суттєво обмежить його здатність підтримувати агентські робочі процеси з вимогами до інтелекту, у тому числі в агентах кодування. Використання токенів: DeepSeek V3.1 отримує поступово вищі бали в режимі міркувань, ніж DeepSeek R1, і використовує трохи менше токенів у всіх показниках, які ми використовуємо для індексу інтелекту штучного аналізу. У режимі без міркувань він використовує трохи більше токенів, ніж V3 0324 - але все одно в кілька разів менше, ніж у власному режимі міркування. API: Перший сторонній API DeepSeek тепер обслуговує нову модель DeepSeek V3.1 як на їхніх кінцевих точках чату, так і на кінцевих точках міркувань - просто змінюючи, чи надається токен кінцевого мислення </think> моделі в шаблоні чату, щоб контролювати, чи буде модель міркувати. Архітектура: DeepSeek V3.1 архітектурно ідентична попереднім моделям V3 і R1, із загальними параметрами 671B і 37B активними параметрами. Наслідки: Ми б радили з обережністю робити будь-які припущення про те, що цей реліз означає про прогрес DeepSeek у напрямку майбутньої моделі, яку в чутках називають V4 або R2. Зазначимо, що раніше DeepSeek випустила фінальну модель, побудовану на їхній архітектурі V2, 10 грудня 2024 року, всього за два тижні до релізу V3.

Найкращі

Рейтинг

Вибране