トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
何が起こるか誰にもわからない
アイデアを持つ一人の人物が、2年で1万人のエージェントを持つ企業の「CEO」を務めることができる
「ソフトウェアは思考」として使われるのではなく、サービスとしてではありません。10億インスタンスの「スウォーム」はバックエンド、フロントエンド、セキュリティ、スケーリングインフラを数分で構築します。
過去18か月間は、コンピュータサイエンス史上最も急速な進歩のペースを記録しました。
ぜひSWEプロについて読んでみてください。汚染に強いように設計されています。このベンチマークで90〜100%のスコアを取った後、ソフトウェアエンジニアリングの全てが解決しない理由はまだ読んだことがありません。これは最も複雑で設計が難しいベンチマークの一つです。タスクが非常に長いため、エージェントは同じセッション内で自分の失敗したテストランから学習できなければなりません。つまり、モデルはこのベンチマークを超えるために何らかの継続的な学習が必要です。
ジェミニ2.5プレビュー 13%の評価
ジェミニ3のプレビューは43%の評価を得ました
Claude Opus 4.5は現在45%でリードしています(scale aiによると)— ANTHROPICでは「一日中CLAUDEを見て、穴埋めをしている」と言う人もいます。
もちろん、彼らが言うインセンティブがあると叫ぶこともできますが、過去2週間のXタイムラインは、モデルたちのコーディング能力の高さに常にショックを受けていたのではないでしょうか?特に4.5版のOpusは?
ソフトウェアエンジニアリングは2年で解決されることは明らかです。たとえ倍増、いや三倍でもなかったとしても、GDPや平均的なアメリカ人の生活に大きな影響を与えるでしょう

トップ
ランキング
お気に入り
