DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Moonshot AI's Kimi K2.5 ist das #2 Modell mit offenen Gewichten und ist jetzt bei 8 Anbietern verfügbar, die jeweils unterschiedliche Preise und Leistungen bieten. Kimi K2.5 von @Kimi_Moonshot ist eines der führenden Modelle mit offenen Gewichten, das 47 im Artificial Analysis Intelligence Index erzielt hat, und seine starke Programmier- und Werkzeugnutzung macht es zu einem beliebten Modell für den Einsatz als Programmieragent. Wir benchmarken die K2.5-Modellendpunkte von 8 API-Anbietern, wobei die Ausgabetoken-Geschwindigkeiten zwischen den schnellsten und langsamsten Anbietern um ~330 Tokens/s variieren - was die Wahl des Anbieters zu einem wichtigen Faktor macht. Wichtige Benchmarking-Ergebnisse: ➤ ⚡ Geschwindigkeit: @basetenco bietet den schnellsten Kimi K2.5-Endpunkt mit 344 Ausgabetokens pro Sekunde, gefolgt von @FireworksAI_HQ (273 t/s) und @novita_labs (52 t/s). ➤ ⏳ Latenz: Wir verfolgen TTFT (Zeit bis zum ersten Token) und TTFAT (Zeit bis zum ersten Antworttoken). Für Denkmodelle ist TTFAT die Schlüsselmetrik, da sie markiert, wann Benutzer die erste nutzbare Ausgabe sehen. Baseten führt bei TTFAT mit 6,5s, gefolgt von Fireworks (7,7s) und Novita AI (39,4s). Bei TTFT führt Fireworks AI mit 0,36s, gefolgt von @togethercompute (0,49s) und Baseten (0,72s). ➤ 💲 Preisgestaltung: @DeepInfra ist der kostengünstigste Anbieter von Kimi K2.5, mit einem Preis von $0,45/M Eingabetokens und $2,25/M Ausgabetokens, 25% günstiger als die teuersten Anbieter. ➤ 🪟 Kontextfenster: Alle Anbieter unterstützen das volle 256k Token Kontextfenster, mit Ausnahme von Baseten, die ein 231k Kontextfenster unterstützen. ➤ 🖼️ Multimodalität: 7 der 8 Anbieter unterstützen die native Multimodalitätseingabefähigkeit von Kimi K2.5, wobei Baseten nur Texteingaben unterstützt. ➤ 🧰 Unterstützte Werkzeuge: Das Aufrufen von Werkzeugen und der JSON-Modus werden von allen 8 Anbietern unterstützt.

Wir benchmarken TTFT (Zeit bis zum ersten Token) und TTFAT (Zeit bis zum ersten Antwort-Token), wobei TTFAT die primäre Kennzahl für Denkmodelle ist. Baseten führt mit 6,5s TTFAT, während Fireworks AI bei TTFT mit 0,36s führt.

Vergleichen Sie Anbieter für Kimi K2.5 (Begründung) bei

2,58K

Top

Ranking

Favoriten