𝗧𝗿𝗮𝗰𝗸𝗶𝗻𝗴 𝗮𝗻𝗱 𝗼𝗯𝗷𝗲𝗰𝘁 𝗱𝗲𝘁𝗲𝗰𝘁𝗶𝗼𝗻 𝗳𝗼𝗿 𝗿𝗼𝗯𝗼𝘁𝗶𝗰𝘀 In de robotica is objectdetectie een momentopname: “er is een fles op (x, y) in dit frame.” Objecttracking is het moeilijkere, meer operationele ding: “dit is dezelfde fles als eerder, hij is zo verplaatst, en hij is er nog steeds, zelfs als ik hem 200 ms niet zie.” Stel je een mobiele manipulator voor op een keukentafel. De taak is eenvoudig op papier: pak de blauwe fles van een rommelige tafel terwijl een persoon in de buurt beweegt. De robot heeft een camera (misschien ook diepte). Hij draait een objectdetector en krijgt een bounding box gelabeld “fles” met een vertrouwensscore. Dat klinkt als waarneming. Dat is het nog niet. In frame 1 ziet de detector de fles. In frame 2 wordt de arm van de persoon gedeeltelijk geblokkeerd, het vertrouwen daalt, en de box verdwijnt. In frame 3 verschijnt de fles weer, maar de detector verschuift de box iets. Vanuit het perspectief van de planner is de fles uit het bestaan geblinkt en geteleporteerd. In rommel krijg je ook duplicaten: de detector kan twee plausibele “fles” boxes voor hetzelfde object produceren. Als de robot direct reageert op per-frame detecties, zie je klassieke faalgedragingen: ➤ hij aarzelt omdat het doel elke paar frames “ontbreekt,” ➤ hij plant constant opnieuw omdat de positie van het doel trilt, ➤ hij reikt naar het verkeerde object wanneer er twee vergelijkbare items verschijnen, ➤ hij kan niet betrouwbaar afdwingen “bots niet met de persoon” omdat de box van de persoon ook flikkert. Dit is waarom robotica-waarneming zelden stopt bij detectie. Het heeft objectpermanentie nodig: het vermogen om te zeggen “dit is nog steeds dezelfde fles, zelfs als ik hem kort uit het oog verlies.” Tracking is wat frame-voor-frame gissingen omzet in een stabiel wereldmodel. Een typische benadering is “tracking-door-detectie”: je draait nog steeds een detector elke frame, maar je koppelt detecties aan persistente tracks (ID's) in de tijd met behulp van voorspelling + associatie. Concreet doet de tracker drie dingen: ➤ Voorspel “waar zou de fles nu moeten zijn?” ➤ Associeer “welke detectie behoort tot welke track?” ➤ Behoud identiteit onder veranderingen ...