Bugün iki robot arasında bir yarış ayarladım. Solda Mac'im, sağda Claude Code. Her ikisi de Stripe'ın yeni Tempo blok zincirinde bir ödeme uygulaması oluşturmakla görevlendirildi. Aynı istemler, aynı görev, yan yana. Opus 4.5, benchmarklarda Qwen 35B'den yaklaşık %20 daha akıllı. Ve muhtemelen 50 kat daha büyük. Tavşan kazanmalıydı. Olmadı. Yerel model 2 dakikada bitti. Claude 6. Claude'dan her iki çıktıyı da puanlamasını istedim: yerel model 6.5, Claude 4.5. Üç kat daha hızlı yanıtlarla, ekstra bir döngü ekleyebilirim: "planı eleştir ve eleştirileri ele al." Tavşan hâlâ düşünürken, kaplumbağa bir tur daha koştu. Daha hızlı yanıtlar, toplantı bitmeden önce daha fazla revizyon turu anlamına gelir Dikkat dağılır. Günlük görevler için daha hızlı modeller, daha sıkı geri besleme döngüleri mümkün olabilir. İşi halletmek için her zaman en akıllı yapay zekaya ihtiyacımız yok.