𝗧𝗿𝗮𝗰𝗸𝗶𝗻𝗴 𝗲𝘁 𝗱𝗲𝘁𝗲𝗰𝘁𝗶𝗼𝗻 𝗱'𝗼𝗯𝗷𝗲𝘁 𝗽𝗼𝘂𝗿 𝗹𝗲𝘀 𝗿𝗼𝗯𝗼𝘁𝘀 Dans la robotique, la détection d'objets est un instantané : « il y a une bouteille à (x, y) dans ce cadre. » Le suivi d'objets est la chose plus difficile et plus opérationnelle : « c'est la même bouteille que précédemment, elle a bougé comme ça, et elle est toujours là même si je ne la vois pas pendant 200 ms. » Imaginez un manipulateur mobile sur un plan de travail de cuisine. La tâche est simple sur le papier : prendre la bouteille bleue d'une table encombrée pendant qu'une personne se déplace à proximité. Le robot a une caméra (peut-être aussi une caméra de profondeur). Il exécute un détecteur d'objets et obtient une boîte englobante étiquetée « bouteille » avec un score de confiance. Cela ressemble à de la perception. Ce n'est pas encore le cas. Dans le cadre 1, le détecteur voit la bouteille. Dans le cadre 2, le bras de la personne l'occlut partiellement, la confiance diminue et la boîte disparaît. Dans le cadre 3, la bouteille réapparaît mais le détecteur déplace légèrement la boîte. Du point de vue du planificateur, la bouteille a clignoté hors de l'existence et s'est téléportée. Dans le désordre, vous obtenez également des doublons : le détecteur peut produire deux boîtes « bouteille » plausibles pour le même objet. Si le robot réagit directement aux détections par cadre, vous voyez des comportements d'échec classiques : ➤ il hésite parce que la cible est « manquante » tous les quelques cadres, ➤ il replanifie constamment parce que la position de la cible tremble, ➤ il atteint l'objet incorrect lorsque deux articles similaires apparaissent, ➤ il ne peut pas appliquer de manière fiable « ne pas entrer en collision avec la personne » parce que la boîte de la personne clignote aussi. C'est pourquoi la perception robotique ne s'arrête que rarement à la détection. Elle a besoin de permanence des objets : la capacité de dire « c'est toujours la même bouteille, même si je la perds de vue brièvement. » Le suivi est ce qui transforme les suppositions cadre par cadre en un modèle du monde stable. Une approche typique est le « suivi par détection » : vous exécutez toujours un détecteur à chaque cadre, mais vous attachez les détections à des pistes persistantes (IDs) au fil du temps en utilisant la prédiction + l'association. Concrètement, le suiveur fait trois choses : ➤ Prédire « où devrait être la bouteille maintenant ? » ➤ Associer « quelle détection appartient à quelle piste ? » ➤ Maintenir l'identité sous les changements ...