トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
泣いても、SOTAはただの顔で、「牛と馬のモデル」に頼らなければ本当に機能しません
OpenRouterの創設者であるAlex Atallahは、自身の最大の使用例がKimi-K2-0711(7月のKimi-K2-Instruct)だとツイートしました。
次にopenai-o4-mini-high、claude-3.7-sonnet、gpt-oss-120b、openai-o3があります
最初に確認したのは、この人はインターネットから離れていて、長い間新しい大型モデルを使っていないのか、ということです。
でもよく考えてみると、いいえ、それは非常に間違っています。 それがパワーユーザーの本当の使い道です。本当にリアルです
もし今の時点で、十分な文脈(128K)、強力な使用能力(SWEベンチ検証済み>65)、強いエージェント能力(Tau2ベンチ>65)、膨大な知識(かなり多くのパラメータ)、迅速な回答(非思考モデル)を持つものを見つけた場合、Kimi-K2-Instructだけが唯一の存在のようです。
逆に言うと、Alex Atallahはおそらく主にドキュメント(特に1340万トークンの長いコンテキスト)を扱い、ツールを使ってレポートを分析・作成(Agent機能)を行い、Kimi-K2-Instructがこれを行っています。さらにスクリプトを書いています(o4とClaude-3.7-Sonnetが下部をカバーし、Kimi-k2がこれらのモデルを呼び出してスクリプトを書くためのエージェントとしてもラップしています)。
最後に、Kimi-k2は最も重要な点であるデータプライバシーも満たしています。なぜなら、このモデルはオープンウェイトであり、独自のサーバー上で展開可能であり、機密情報がOpenAIやAnthropicに漏洩しないからです。 以下のGPT-OSS-120Bもここで意味を持つはずです。
新しい大規模モデルがエージェントの能力に満ちており、人間によるAIの直接利用はまだ中段階であり、高度なユーザーはすでにAIを使ってAIを操作しています。すべてのAIコンテキストを送受信するためにエージェント専用モデルを使うことは、必然的に最も多く使われるでしょう。
元のスレッド:


トップ
ランキング
お気に入り
