DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Le Kimi K2.5 de Moonshot AI est le modèle à poids ouverts n°2, et est désormais disponible auprès de 8 fournisseurs, chacun avec des prix et des performances différents. Le Kimi K2.5 de @Kimi_Moonshot est l'un des principaux modèles à poids ouverts, avec un score de 47 sur l'Indice d'Analyse de l'Intelligence Artificielle, et sa forte capacité de codage et d'utilisation d'outils en fait un modèle populaire pour être utilisé comme agent de codage. Nous évaluons les points de terminaison du modèle K2.5 de 8 fournisseurs d'API, avec des vitesses de jetons de sortie variant d'environ 330 jetons/s entre les fournisseurs les plus rapides et les plus lents - ce qui rend le choix du fournisseur un facteur important. Principaux enseignements des évaluations : ➤ ⚡ Vitesse : @basetenco propose le point de terminaison Kimi K2.5 le plus rapide à 344 jetons de sortie par seconde, suivi de @FireworksAI_HQ (273 t/s) et @novita_labs (52 t/s). ➤ ⏳ Latence : Nous suivons le TTFT (temps jusqu'au premier jeton) et le TTFAT (temps jusqu'au premier jeton de réponse). Pour les modèles de raisonnement, le TTFAT est la métrique clé car il marque le moment où les utilisateurs voient pour la première fois une sortie utilisable. Baseten est en tête sur le TTFAT à 6,5s, devant Fireworks (7,7s) et Novita AI (39,4s). Pour le TTFT, Fireworks AI est en tête à 0,36s, suivi de @togethercompute (0,49s) et Baseten (0,72s). ➤ 💲 Tarification : @DeepInfra est le fournisseur le moins cher de Kimi K2.5, avec un prix de 0,45 $/M jetons d'entrée et 2,25 $/M jetons de sortie, 25 % moins cher que les fournisseurs les plus chers. ➤ 🪟 Fenêtre de contexte : Tous les fournisseurs prennent en charge la fenêtre de contexte complète de 256k jetons, sauf Baseten, qui prend en charge une fenêtre de contexte de 231k. ➤ 🖼️ Multimodalité : 7 des 8 fournisseurs prennent en charge la capacité d'entrée multimodale native du Kimi K2.5, Baseten ne prenant en charge que l'entrée textuelle. ➤ 🧰 Outils pris en charge : L'appel d'outils et le mode JSON sont pris en charge par les 8 fournisseurs.

Nous mesurons le TTFT (temps jusqu'au premier jeton) et le TTFAT (temps jusqu'au premier jeton de réponse), le TTFAT étant la principale métrique pour les modèles de raisonnement. Baseten est en tête avec un TTFAT de 6,5s, tandis que Fireworks AI est en tête du TTFT avec 0,36s.

Comparez les fournisseurs pour Kimi K2.5 (Raisonnement) à

2,58K

Meilleurs

Classement

Favoris