一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

为什么你应该停止从事强化学习研究，而是专注于产品 // 解锁人工智能大规模转变的技术是互联网，而不是变压器我认为大家都知道数据是人工智能中最重要的东西，而且研究人员选择不去研究它……在可扩展的方式上，研究数据意味着什么？互联网提供了丰富的、丰富的数据来源，这些数据多样，提供了自然的课程，代表了人们真正关心的能力，并且是一种经济上可行的技术，可以大规模部署——它成为了下一个标记预测的完美补充，并且是人工智能起飞的原始汤。没有变压器，任何数量的方法都可能起飞，我们可能会有CNN或状态空间模型达到GPT-4.5的水平。但自从GPT-4以来，基础模型并没有显著改善。推理模型在狭窄领域表现出色，但并没有像2023年3月的GPT-4那样取得巨大的飞跃（已经超过两年了……）我们在强化学习方面有一些伟大的东西，但我深深担心我们会重蹈过去的覆辙（2015-2020年期间的强化学习），进行无关紧要的强化学习研究。就像互联网是监督预训练的对偶，什么将是强化学习的对偶，能够带来像GPT-1到GPT-4那样的巨大进步？我认为这看起来像是研究-产品共同设计。

389.65K