Zijn er goede modellen met echt hoge token/s die slechts 6-12 maanden achterlopen op de huidige SOTA-modellen in mogelijkheden? Ik denk dat ik de intelligentie-hit kan nemen als ik lokaal kan draaien en echt snelle feedback krijg, waardoor het interactie met de agent meer als een vim-sneltoets dan een gesprek wordt.