Kimi K2.5 от Moonshot AI — это модель с открытыми весами №2, и теперь она доступна у 8 провайдеров, каждый из которых предлагает разные цены и производительность. Kimi K2.5 от @Kimi_Moonshot является одной из ведущих моделей с открытыми весами, набрав 47 баллов в Индексе Искусственного Интеллекта Анализа, а ее сильные навыки программирования и использования инструментов делают ее популярной моделью для использования в качестве агента программирования. Мы проводим бенчмаркинг конечных точек модели K2.5 от 8 провайдеров API, с скоростью токенов на выходе, варьирующейся примерно на 330 токенов/с между самыми быстрыми и медленными провайдерами — что делает выбор провайдера важным фактором. Ключевые выводы бенчмаркинга: ➤ ⚡ Скорость: @basetenco предоставляет самую быструю конечную точку Kimi K2.5 с 344 токенами на выходе в секунду, за ней следуют @FireworksAI_HQ (273 т/с) и @novita_labs (52 т/с). ➤ ⏳ Задержка: Мы отслеживаем TTFT (время до первого токена) и TTFAT (время до первого токена ответа). Для моделей рассуждений TTFAT является ключевым показателем, так как он указывает, когда пользователи впервые видят полезный вывод. Baseten лидирует по TTFAT с 6.5с, опережая Fireworks (7.7с) и Novita AI (39.4с). По TTFT, Fireworks AI лидирует с 0.36с, за ним следуют @togethercompute (0.49с) и Baseten (0.72с). ➤ 💲 Цены: @DeepInfra является самым дешевым провайдером Kimi K2.5, цена составляет $0.45/M входных токенов и $2.25/M выходных токенов, на 25% дешевле, чем у самых дорогих провайдеров. ➤ 🪟 Контекстное окно: Все провайдеры поддерживают полное контекстное окно в 256k токенов, за исключением Baseten, который поддерживает контекстное окно в 231k токенов. ➤ 🖼️ Мультимодальность: 7 из 8 провайдеров поддерживают родную мультимодальную входную способность Kimi K2.5, при этом Baseten поддерживает только текстовый ввод. ➤ 🧰 Поддерживаемые инструменты: Вызов инструментов и режим JSON поддерживаются всеми 8 провайдерами.
Мы сравниваем TTFT (время до первого токена) и TTFAT (время до первого токена ответа), при этом TTFAT является основным показателем для моделей рассуждений. Baseten лидирует с TTFAT 6.5с, в то время как Fireworks AI лидирует по TTFT с 0.36с.
Сравните провайдеров для Kimi K2.5 (Reasoning) в 
2,57K