分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

なぜGPUにこだわるのかと聞かれます Mac StudiosやMac minisではありませんその理由は以下の通りです: - Llama 3.1 70B BF16(8台RTX 3090搭載) - 50+ 同時リクエスト - バッチ推論 - 持続的処理量それだけでなく： > リクエストあたり ~2k コンテキスト(プロンプト) > ~1.8k トークンの出力 > 2分29秒で50件の回答を送りましたこれはGPUの領域です。 Macではこれができません。少なくとも今のところは。

トップ

ランキング

お気に入り