Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Seguimiento y detección de objetos para robótica
En robótica, la detección de objetos es una instantánea: "hay una botella en (x, y) en este marco."
El seguimiento de objetos es lo más difícil y operativo: "esta es la misma botella que antes, se movía así, y sigue ahí aunque no la vea en 200 ms."
Imagina un manipulador móvil en la encimera de la cocina. La tarea es sencilla en el papel: coger la botella azul de una mesa desordenada mientras una persona se mueve cerca.
El robot tiene cámara (quizá también profundidad). Ejecuta un detector de objetos y recibe una caja delimitadora etiquetada como "botella" con una puntuación de confianza. Eso suena a percepción. Todavía no lo es.
En el fotograma 1, el detector ve la botella. En el frame 2, el brazo de la persona lo oculta parcialmente, la confianza baja y la caja desaparece. En el fotograma 3 la botella reaparece pero el detector mueve ligeramente la caja. Desde la perspectiva del planificador, la botella ha desaparecido y se ha teletransportado.
En el desorden, también aparecen duplicados: el detector puede producir dos cajas "botella" plausibles para el mismo objeto. Si el robot reacciona directamente a las detecciones por fotograma, se observan comportamientos clásicos de fallo:
➤ duda porque el objetivo "falta" cada pocos fotogramas,
➤ se replanifica constantemente porque la posición objetivo titubea,
➤ se acerca al objeto equivocado cuando aparecen dos objetos similares,
➤ No puede hacer cumplir de forma fiable "no choques con la persona" porque la caja de la persona también parpadea.
Por eso la percepción en robótica rara vez se detiene en la detección. Necesita permanencia objetiva: la capacidad de decir "esta sigue siendo la misma botella, aunque la pierda de vista brevemente."
El seguimiento es lo que convierte las conjeturas fotograma a cuadro en un modelo de mundo estable.
Un enfoque típico es el "seguimiento por detección": sigues ejecutando un detector en cada fotograma, pero asocias detecciones a pistas persistentes (IDs) a lo largo del tiempo usando predicción + asociación.
Concretamente, el rastreador hace tres cosas:
➤ Predecir "¿dónde debería estar la botella ahora?"
➤ Asociar "¿a qué pista pertenece la detección de qué pista?"
➤ Mantener la identidad bajo cambios
...

Populares
Ranking
Favoritas
