Відстеження та виявлення об'єктів у робототехніці У робототехніці виявлення об'єктів — це знімок: «у цій рамці є пляшка в (x, y)». Відстеження об'єктів — це складніше, більш оперативне завдання: «це та сама пляшка, що й раніше, вона рухалася ось так, і вона досі там, навіть якщо я не бачу її 200 мс.» Уявіть собі мобільного маніпулятора на кухонній стільниці. Завдання просте на папері: взяти синю пляшку з захаращеного столу, поки поруч хтось рухається. У робота є камера (можливо, глибина теж). Він запускає детектор об'єктів і отримує обмежувальну коробку з написом «пляшка» з рейтингом довіри. Це звучить як сприйняття. Ще ні. На кадрі 1 детектор бачить пляшку. На другому кадрі рука людини частково перекриває його, впевненість падає, і коробка зникає. На третьому кадрі пляшка з'являється знову, але детектор трохи зсуває коробку. З точки зору планувальника, пляшка зникла і телепортувалася. У безладі ви також отримуєте дублікати: детектор може створити дві правдоподібні «пляшкові» коробки для одного й того ж об'єкта. Якщо робот реагує безпосередньо на виявлення за кадр, ви бачите класичні поведінкові відмови: ➤ Вона вагається, бо ціль «відсутня» кожні кілька кадрів, ➤ Вона постійно переплановується, бо позиція цілі тремтить, ➤ Він тягнеться до неправильного об'єкта, коли з'являються два схожі елементи, ➤ Він не може надійно виконувати «не зіткнися з людиною», бо коробка людини теж мерехтить. Ось чому сприйняття робототехніки рідко зупиняється на виявленні. Йому потрібна постійність об'єкта: здатність сказати: «це все ще та сама пляшка, навіть якщо я на мить її втратю». Відстеження перетворює покадрові здогадки на стабільну модель світу. Типовий підхід — «відстеження за виявленням»: детектор все одно запускається кожен кадр, але з часом приєднуєш виявлення до постійних треків (ID) за допомогою прогнозу + асоціації. Конкретно, трекер виконує три речі: ➤ Передбачте «де має бути пляшка зараз?» ➤ Асоціювати «яке виявлення належить якому треку?» ➤ Збереження ідентичності під час змін ...