Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Kimi K2.5 від Moonshot AI — це модель #2 з відкритими вагами, і тепер доступна у 8 провайдерів, кожен з різною ціною та продуктивністю
Kimi K2.5 з @Kimi_Moonshot року є однією з провідних моделей відкритих ваг, набравши 47 балів у Індексі штучного аналізу інтелекту, а її сильне кодування та використання інструментів роблять її популярною моделлю для використання як кодувального агента. Ми проводимо бенчмарк кінцевих точок моделі K2.5 від 8 провайдерів API, при цьому швидкість виводних токенів варіюється на ~330 токенів/с між найшвидшими та найповільнішими провайдерами — тому вибір провайдера є важливим фактором.
Основні висновки з бенчмаркінгу:
➤ ⚡ Швидкість: @basetenco обслуговує найшвидшу кінцеву точку Kimi K2.5 з 344 вихідними токенами за секунду, за нею йдуть @FireworksAI_HQ (273 т/с) і @novita_labs (52 т/с)
➤ ⏳ Затримка: Ми відстежуємо TTFT (час до першого токена) та TTFAT (час до першого токена). Для моделей логіки ключовим показником є TTFAT, оскільки він позначає, коли користувачі вперше бачать корисний вихід. Baseten лідирує на TTFAT з 6,5 с, випереджаючи Fireworks (7,7 с) та Novita AI (39,4 с). Для TTFT Fireworks AI лідирує з 0,36 с, за ним йдуть @togethercompute (0,49 с) і Baseten (0,72 с)
➤ 💲 Ціноутворення: @DeepInfra є найдешевшим постачальником Kimi K2.5, ціна якого становить $0.45/млн вхідних токен і $2.25/M, на 25% дешевше, ніж найдорожчі провайдери
➤ 🪟 Контекстне вікно: Всі провайдери підтримують повне контекстне вікно 256k токенів, окрім Baseten, який підтримує контекстне вікно 231k
➤ 🖼️ Мультимодальність: 7 із 8 провайдерів підтримують власну мультимодальну можливість введення Kimi K2.5, при цьому Baseten підтримує лише текстовий вхід
➤ 🧰 Підтримувані інструменти: Виклик інструментів і режим JSON підтримуються всіма 8 провайдерами

Ми бенчмаркуємо TTFT (час до першого токена) та TTFAT (час до першої відповіді), причому TTFAT є основною метрикою для моделей мислення. Baseten лідирує з TTFT 6,5 с, а Fireworks AI — з 0,36 с.

Порівняйте постачальників для Kimi K2.5 (Reasoning) за адресою
2,59K
Найкращі
Рейтинг
Вибране
