När din agent känner sig långsam eller inkonsekvent beror det ofta på att den använder fel modell för jobbet. Många agenter använder sin "smartaste" modell för allt. Det är som att använda en superdator för att kontrollera stavning! En enklare lösning är att låta agenten bestämma hur mycket intelligens uppgiften faktiskt behöver innan den svarar. 1. Be agenten klassificera uppgiften som enkel, kreativ eller analytisk. 2. Styr den till en lättviktsmodell för enkelt arbete och en tung resonemangsmodell endast när analys krävs. Personer som gör detta rapporterar lägre latens, färre fel och dramatiskt lägre kostnader i stor skala.