Şüphe edenleri dinleme, Gemini 3 her türlü kodlama görevinde son derece iyi. Web uygulamaları için kullanıcı arayüzü, Swift'teki iOS geliştirme, Python'daki arka uç kodu, yapay zeka/ML ile ilgili her şey gibi her şey. Gerçekten güçlü ve kurallara uymak, araçlar kullanmakta iyidir.
Görünüşe göre büyük bir sınır modeli piyasaya sürüldüğünde, nüfuz peşinde koşan bir grup insan bunun ne kadar "hayal kırıklığına uğrattığını" ve kendi görevlerini başarısız ettiğini söylüyor. Genellikle onların yönlendirmede berbat olduğunu ya da görevlerinin gerçek hayatta aptalca ve hiç alakasız olduğunu göreceksiniz.
Bazı istisnalar var, mesela Llama4, ki 3 dakika deneyen herkes için açıkça berbattı. Ama insanlar GPT-5 hakkında bunu söyledi ve bu gülünç derecede yanlıştı. Tıpkı borsada olduğu gibi, insanlar şüpheci ve karşıtlık nedeniyle daha fazla ilgi görüyor. Negatiflik satıyor
Önemli olan (en azından kodlama için) modelin yazılım geliştirmede benzer modelleri kullanmakta zaten yetenekli olanlar için ne kadar iyi olması ve saatlerce çeşitli gerçekçi, gerçek dünya görevlerinde denedikten sonra onların mantıklı görüşleri, aptalca yakalama problemleri değil.
Modelin ne kadar tutarlı ve özerk olduğunu, ne kadar özdenetim ve "azimlilik" gösterdiğini görmek için gerçek zaman ve birçok bağımsız deneme gerekiyor (bunların bir kısmı da ajan harness'e bağlı, yani Cursor ile Gemini-CLI), araçlarla ne kadar güvenilir olduğunu görmek için.
Gemini 3, tüm bu boyutlarda büyük bir şekilde parlıyor. Google, bu modelle kendisi için muazzam bir pazar değeri yarattı, özellikle de kendi özel silikon sistemlerinde maliyet fiyatına barındırabildiği için.
Başkalarının fiyat-performans eğrisinde bu noktaya yaklaşması zor (neredeyse imkansız) olacak. GPT-6 biraz daha akıllı olsa bile, "Nvidia vergisi"ni ödendikten ve Jensen'e %90 brüt kâr marjını verdikten sonra OpenAI'ye sunulan hosting maliyetleri Pareto açısından yetersiz kalmasına neden olacak.
12,62K