𝗧𝗿𝗮𝗰𝗸𝗶𝗻𝗴 𝗲 𝗱𝗲𝘁𝗲𝗰𝗰𝗮𝗼 𝗱𝗲 𝗼𝗯𝗷𝗲𝗰𝘁𝗼𝘀 𝗻𝗮 𝗿𝗼𝗯𝗼𝘁𝗶𝗰𝗮 Na robótica, a deteção de objetos é uma instantânea: “há uma garrafa em (x, y) neste quadro.” O rastreamento de objetos é a parte mais difícil e operacional: “esta é a mesma garrafa de antes, ela se moveu assim, e ainda está lá mesmo que eu não a veja por 200 ms.” Imagine um manipulador móvel em uma bancada de cozinha. A tarefa é simples no papel: pegar a garrafa azul de uma mesa desordenada enquanto uma pessoa se move nas proximidades. O robô tem uma câmera (talvez também de profundidade). Ele executa um detector de objetos e obtém uma caixa delimitadora rotulada como “garrafa” com uma pontuação de confiança. Isso soa como percepção. Mas ainda não é. No quadro 1, o detector vê a garrafa. No quadro 2, o braço da pessoa a oclui parcialmente, a confiança cai e a caixa desaparece. No quadro 3, a garrafa reaparece, mas o detector desloca ligeiramente a caixa. Do ponto de vista do planejador, a garrafa piscou para fora da existência e teletransportou-se. Em meio à desordem, você também obtém duplicatas: o detector pode produzir duas caixas plausíveis de “garrafa” para o mesmo objeto. Se o robô reage diretamente às detecções por quadro, você vê comportamentos clássicos de falha: ➤ ele hesita porque o alvo está “faltando” a cada poucos quadros, ➤ ele replano constantemente porque a posição do alvo oscila, ➤ ele alcança o objeto errado quando dois itens semelhantes aparecem, ➤ ele não consegue impor de forma confiável “não colidir com a pessoa” porque a caixa da pessoa também pisca. É por isso que a percepção robótica raramente para na deteção. Ela precisa de permanência do objeto: a capacidade de dizer “esta ainda é a mesma garrafa, mesmo que eu perca a vista dela brevemente.” O rastreamento é o que transforma palpites quadro a quadro em um modelo de mundo estável. Uma abordagem típica é “rastreamento por deteção”: você ainda executa um detector a cada quadro, mas você anexa as detecções a trilhas persistentes (IDs) ao longo do tempo usando previsão + associação. Concretamente, o rastreador faz três coisas: ➤ Prever “onde a garrafa deve estar agora?” ➤ Associar “qual deteção pertence a qual trilha?” ➤ Manter a identidade sob mudanças ...