Inception Labs запустила Mercury 2, свою готовую к производству LLM следующего поколения. Mercury 2 достигает >1,000 токенов/с с значительными улучшениями в интеллекте Diffusion LLMs (“dLLMs”) @_inception_ai используют другую архитектуру по сравнению с LLM на основе автогрессии. Процесс генерации Diffusion LLM начинается с шума и итеративно уточняет вывод, используя трансформер, который может изменять несколько токенов параллельно. Это позволяет параллелизовать генерацию выходных токенов, что обеспечивает более высокую скорость вывода, так как многие выходные токены генерируются одновременно. Ключевые выводы: ➤ Среди моделей сопоставимого размера/ценового класса Mercury 2 демонстрирует конкурентоспособные результаты в интеллекте по сравнению со скоростью вывода. Хотя он не обладает ведущим интеллектом, его скорость вывода более чем в 3 раза превышает скорость следующей самой быстрой модели в этом классе (бенчмарки основаны на первых сторонних конечных точках или медиане провайдеров, обслуживающих модель, где первая сторонняя конечная точка недоступна) ➤ Ключевые сильные стороны включают агентное кодирование и использование терминала, а также следование инструкциям. Mercury 2 показывает аналогичные результаты с Claude 4.5 Haiku на Terminal-Bench Hard и набирает 70% на IFBench (Следование Инструкциям), превосходя gpt-oss-120B, GPT-5.1 Codex mini и GPT-5 nano Фон Inception Labs: Это второй релиз от Inception Labs. Основатели ранее были профессорами Стэнфорда, UCLA и Корнелла и внесли вклад в исследования и технологии ИИ, включая Flash Attention, Decision Transformers и Direct Preference Optimization (DPO). Смотрите ниже для дальнейшего анализа.
Сравнение скорости вывода с другими моделями (бенчмарки основаны на первых сторонних конечных точках или медиане провайдеров, обслуживающих модель, где первая сторонняя конечная точка недоступна)
Mercury 2 показывает результаты выше среднего по сравнению с небольшими сопоставимыми моделями по нескольким оценкам, включая GDPval-AA, Terminal-Bench Hard и 𝜏²-Bench Telecom, при этом предлагая высокие скорости вывода.
Смотрите Искусственный Анализ для получения дополнительных деталей и эталонов Mercury 2:
11,34K