الاختبار الأساسي لمعرفة ما إذا كانت فكرة منتج LLM جيدة أم لا هو ما إذا كان نموذج Frontier يمكنه إنجاز 95٪+ من المهمة الآن خارج الصندوق. إذا كان الجواب نعم — الرمز؛ الكتابة اليدوية؛ من قبل التعداد؛ rag + chat — إذن الآن هو الوقت المناسب.
برأيي، أسوأ مكان هو المنتجات التي تكون فيها النماذج حوالي 80٪ من الطريق. لكي تنجح عليك إدارة الطلبات السريعة، وتراكب المعرفة المتخصصة، إلخ — بمعنى آخر، اعمل على وضع نفسك لتخسر إذا تحسنت النماذج وتخسر إذا لم تفعل
ربما يمكنك تخمين مدى بعدك من خلال أخذ مدى جودة النماذج الآن وتقسيم الفجوة إلى 95+ على مدى تحسنها في المهمة في الجيل الأخير. بالنسبة لكثير من المهام التي تصل إلى 80٪، ربما يكون مثل... 4-5 سنوات؟ أطول للوكلاء
في كثير من هذه القطاعات، أظن أن المنتجات القائمة ستتفوق عليها الوافدون الجدد لهذا السبب بالذات — فقد استثمروا رأس المال في حل المشكلات التي سيحلها المنافسون الجدد مباشرة من واجهة برمجة التطبيقات
بالإضافة إلى ذلك، سيكون لديهم ميزة رؤية شركات ناجحة في مجالات أخرى تحل مشاكل الواجهة والنمو (كما رأينا في وسائل التواصل الاجتماعي وSAA)
وهذا صحيح بشكل خاص لأنني أظن أن العديد من منتجات نماذج اللغة الكبيرة مضغوطة بالفعل من قبل المنافسة الكبرى لتبني نماذج أعمال أسهل في التحريك، وبالتالي لن يكون لها أي ضمان كبير عندما يظهر منافسون أفضل
‏‎1.81‏K