私たちは最速の推論を構築するために、@cerebrasと協力しています。 まもなくAmazon Bedrockに登場予定で、AWS Trainium3を接続し、計算集約的なプリフィルをCerebras CS-3と接続し、パワーデコードを行うことで、現在利用可能な推論性能を桁違いに速く提供します。 パートナーシップについて詳しくはこちらをご覧ください。