热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
机器人中的跟踪和物体检测
在机器人技术中,物体检测是一个快照:“在这个帧中,(x, y) 处有一个瓶子。”
物体跟踪是更难、更具操作性的事情:“这是之前的同一个瓶子,它这样移动,即使我在 200 毫秒内看不见它,它仍然在那里。”
想象一下一个在厨房台面上的移动操控器。任务在纸面上很简单:在一个杂乱的桌子上拿起蓝色瓶子,同时一个人就在附近移动。
机器人有一个相机(也许还有深度相机)。它运行一个物体检测器,并获得一个标记为“瓶子”的边界框和一个置信度分数。这听起来像是感知,但还不是。
在帧 1 中,检测器看到了瓶子。在帧 2 中,人的手臂部分遮挡了它,置信度下降,框消失了。在帧 3 中,瓶子重新出现,但检测器稍微移动了框。从规划者的角度来看,瓶子似乎消失了并瞬移了。
在杂乱中,你还会得到重复:检测器可能会为同一个物体生成两个合理的“瓶子”框。如果机器人直接对每帧的检测做出反应,你会看到经典的失败行为:
➤ 它犹豫,因为目标在每几帧中“消失”,
➤ 它不断重新规划,因为目标位置抖动,
➤ 当两个相似物体出现时,它朝错误的物体伸手,
➤ 它无法可靠地执行“不要与人碰撞”,因为人的框也在闪烁。
这就是为什么机器人感知很少停留在检测上。它需要物体的持久性:能够说“即使我短暂失去视线,这仍然是同一个瓶子。”
跟踪是将逐帧猜测转变为稳定世界模型的过程。
一种典型的方法是“基于检测的跟踪”:你仍然在每帧运行检测器,但你将检测结果附加到随时间变化的持久轨迹(ID)上,使用预测 + 关联。
具体来说,跟踪器做三件事:
➤ 预测“瓶子现在应该在哪里?”
➤ 关联“哪个检测属于哪个轨迹?”
➤ 在变化下保持身份
...

热门
排行
收藏
