2月28日に8400万トークンを消費しました。企業の調査、メモの作成、エージェントの運営。 それはAPI経由でサーバーレスモデルのKimi K2.5を動かしています。ClaudeやOpenAIのレート(約9ドル)で、100万トークンを組み合わせて約9ドル、同等の使用費は1日の作業で756ドルかかります。私のピーク日は8,000万トークンに達しました。私の平均的な日は2000万日です。フロンティアモデル価格でのクラウド推論はすぐに積み重なります。
今週、アリババは2025年12月のClaude Opus 4.1に匹敵するオープンソースモデルQwen3.5-9Bをリリースしました。ローカルで12GBのRAMで動作します。3か月前には、この機能にはデータセンターが必要でした。今は電源コンセントが必要です。
5,000ドルのノートパソコン、つまりQwenをローカルで動かせる十分なメモリを持つMacBook Proは、5億5600万トークンを消費すれば元本が取れます。私の使用率だと約1ヶ月です。1日2,000万トークンなら4週間です。 回収後は限界費用が電力に下がります。 これは情報的な妥協ではありません。推論、コーディング、エージェント型ワークフロー、文書処理、指示に従う:9Bモデルは12月のフロンティアと全体的に一致しています。
@twlvone 計算量を増やすだけでは、ツール呼び出しの精度をある程度上げる以外は役に立ちません
91