Cuando tu agente se siente lento o inconsistente, a menudo es porque está usando el modelo equivocado para el trabajo. Muchos agentes recurren por defecto a su modelo "más inteligente" para todo. ¡Eso es como usar un superordenador para revisar la ortografía! Una solución más limpia es dejar que el agente decida cuánta inteligencia necesita realmente la tarea antes de responder. 1. Pide al agente que clasifique la tarea como simple, creativa o analítica. 2. Enrutarla a un modelo ligero para trabajo sencillo y a un modelo de razonamiento pesado solo cuando se requiere análisis. Las personas que hacen esto informan de menor latencia, menos fallos y costes dramáticamente más bajos a gran escala.