Finnes det noen anstendige modeller med veldig høye token(er) som bare ligger 6-12 måneder bak dagens SOTA-modeller i kapasitet? Jeg tenker at jeg kan tåle intelligens-tapet hvis jeg klarer å løpe lokalt og få veldig rask tilbakemelding, gjøre samhandlingen med agenten mer som en snarvei enn en samtale