Finns det några bra modeller med riktigt höga token/tokens som bara ligger 6-12 månader efter nuvarande SOTA-modeller i kapacitet? Jag tänker att jag kan ta intelligenssmällen om jag kan springa lokalt och få väldigt snabb feedback, göra interaktionen med agenten mer som en snabbväg än en konversation