今日は2体のロボットによるレースを設定しました。 左側に私のMac、右側にClaude Code。両者ともStripeの新しいTempoブロックチェーン上で決済アプリを構築する任務を負っています。同じプロンプト、同じタスク、並んで。 Opus 4.5はベンチマークでQwen 35Bより約20%賢いです。しかもおそらく50倍の規模です。ウサギが勝つべきだった。しかし、そうはなりませんでした。 地元のモデルは2分で終わった。クロードが6を担当しました。私はClaudeに両方の出力、ローカルモデル6.5、Claude 4.5のスコアを付けてもらいました。 3倍速い回答があれば、さらに「計画を批評し、批評に答える」というサイクルを追加できます。ウサギがまだ考えている間に、カメはもう一周走りました。 返答が速いほど、会議終了までにさらに多くの修正ラウンドが行われます。注意が逸れる。日常の作業においては、より速いモデルがよりタイトなフィードバックループを可能にします。 仕事を成し遂げるために必ずしも最も賢いAIが必要なわけではありません。