トークン数が本当に高い、しかも現在のSOTAモデルより6〜12ヶ月遅れのまともなモデルはありますか? ローカルで実行できて非常に速いフィードバックが得られれば、エージェントとのやり取りを会話というよりvimのショートカットのように感じられるようにして、知能の低下を受け入れられると思っています