热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我特别期待的SAM 3D背后的技术之一:
1⃣ 现有的3D数据集(Objaverse-XL、ProcTHOR等)非常适合教授“3D先验”(基本形状和外观)。但它们不足以完全弥补与现实世界之间的差距,现实场景往往杂乱无章,物体被遮挡、体积小且通常比较混乱。
2⃣ 进入我们的模型循环3D数据引擎:模型 ➜ 从真实图像预测3D ➜ 人工快速审核合适的候选(仅限是/否) ➜ 审核通过的3D数据返回训练 ➜ 改进后的模型重新进入循环。这是一个良性循环,提升了3D标注质量、标注速度和模型性能,而无需3D工具或设计专业知识。
3⃣ 3D目标很棘手:没有封闭形式的可微损失能够完全捕捉“良好的3D特性”(对称性、平滑性、完整性)。因此,我们借鉴了LLM的做法,使用人类偏好数据进行后训练。这种对齐在指标中几乎没有体现(这些指标继承了损失的相同局限性),但它显著提高了3D输出的感知质量。
更多细节请参见论文。
热门
排行
收藏

