热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
判断一个LLM产品创意是否优秀的试金石是,当前是否有前沿模型能够开箱即用地完成95%以上的任务。如果答案是肯定的——编码;记录;表单预填充;rag + 聊天——那么现在就是好时机。
在我看来,最糟糕的情况是产品的模型大约完成了80%。要使其正常工作,你必须进行大量的提示管理,叠加专业知识等——换句话说,努力让自己处于一个无论模型改进与否都可能失败的境地。
也许你可以通过现在模型的表现来猜测你距离目标有多远,将95%以上的差距除以它们在最近一代任务中的改进程度。对于很多80%的任务,这大概需要……4-5年?对于代理来说更长。
在许多这些领域,我怀疑现有产品将会被新进入者击败,正是因为这个原因——他们会在解决问题上投入沉没资本,而新竞争者将直接通过 API 来解决这些问题。
此外,他们将受益于看到其他行业成功公司解决界面和增长问题(就像我们在社交媒体和SaaS中看到的那样)
尤其如此,因为我怀疑许多 LLM 产品已经被大公司竞争挤压,采用了更容易被替代的商业模式,因此在更好的竞争者出现时几乎没有锁定效应。
1.8K
热门
排行
收藏

