Rastreamento e detecção de objetos para robótica Em robótica, a detecção de objetos é um instantâneo: "há uma garrafa em (x, y) neste quadro." Rastreamento de objetos é a coisa mais difícil e operacional: "essa é a mesma garrafa de antes, ela se moveu assim, e ainda está lá mesmo que eu não veja por 200 ms." Imagine um manipulador móvel em um balcão da cozinha. A tarefa é simples no papel: pegar a garrafa azul de uma mesa bagunçada enquanto uma pessoa se move por perto. O robô tem uma câmera (talvez profundidade também). Ele executa um detector de objetos e recebe uma caixa delimitadora rotulada como "garrafa" com um índice de confiança. Isso parece percepção. Ainda não é. No quadro 1, o detector vê a garrafa. No frame 2, o braço da pessoa o oclui parcialmente, a confiança cai e a caixa desaparece. No quadro 3, a garrafa reaparece, mas o detector move levemente a caixa. Do ponto de vista do planejador, a garrafa desapareceu e se teleportou. Na bagunça, você também tem duplicatas: o detector pode produzir duas caixas "garrafa" plausíveis para o mesmo objeto. Se o robô reage diretamente às detecções por quadro, você vê comportamentos clássicos de falha: ➤ hesita porque o alvo está "faltando" a cada poucos quadros, ➤ ele replaneja constantemente porque a posição alvo treme, ➤ ele alcança o objeto errado quando dois itens semelhantes aparecem, ➤ não consegue aplicar de forma confiável "não colida com a pessoa" porque a caixa da pessoa também pisca. É por isso que a percepção robótica raramente para na detecção. Precisa de permanência do objeto: a capacidade de dizer "esta ainda é a mesma garrafa, mesmo que eu a perca de vista por um momento." O rastreamento é o que transforma palpites quadro a quadro em um modelo de mundo estável. Uma abordagem típica é o "rastreamento por detecção": você ainda executa um detector a cada quadro, mas anexa detecções a trilhas persistentes (IDs) ao longo do tempo usando previsão + associação. Concretamente, o rastreador faz três coisas: ➤ Prever "onde a garrafa deve estar agora?" ➤ Associate "qual detecção pertence a qual trilha?" ➤ Manter identidade sob mudanças ...