Bir LLM ürün fikrinin iyi olup olmadığına dair bir test, bir Frontier modelinin kutudan çıktığı anda görevin %95+ kısmını yapıp yapamayacağıdır. Cevap evet ise — kod; yazı yazarlığı; pre-popülasyon oluşturur; Rag + Chat — o zaman şimdi iyi olur.
Ben en kötü nokta, modellerin %80'i oraya kadar geldiği ürünler. Bunu çalıştırmak için bir sürü hızlı yönetim yapmanız, uzman bilgisini üst üste koymanız gerekiyor — yani modeller gelişirse kaybedecek ve gelişmezse kaybedecek şekilde kendinizi konumlandırmaya çalışın
Belki de modellerin şu anki kalitesini alıp 95+ aralarındaki farkı en son nesilde bu görevde ne kadar geliştiklerine bölerek tahmin edebilirsiniz. %80 görevlerin çoğunda muhtemelen şöyle demek... 4-5 yıl mı? ajanlar için daha uzun
Bu dikey birçok sektörde, mevcut ürünlerin yeni katılımcılar tarafından geride bırakılacağını düşünüyorum — yeni rakiplerin doğrudan API'den çözeceği sorunları çözmek için sermaye harcamış olacaklar
Ayrıca, diğer dikeylerde başarılı şirketlerin arayüz ve büyüme sorunlarını çözdüğünü görme avantajına sahip olacaklar (örneğin sosyal medya ve saas'larda gördüğümüz gibi)
Özellikle de birçok LLM ürününün Bigco rekabeti tarafından daha kolay bir üretim yapabilen iş modellerini benimsemeye zorlandığını ve bu yüzden daha iyi rakipler ortaya çıktığında pek az kilitlenme olacağını düşünüyorum
1,82K