Existem modelos decentes com tokens muito altos que estejam apenas 6-12 meses atrás dos modelos atuais da SOTA em capacidades? Acho que poderia assumir a perda de inteligência se conseguir rodar localmente e receber feedback muito rápido, tornando a interação com o agente mais um atalho de energia do que uma conversa