Gibt es anständige Modelle mit wirklich hohen Token/s, die nur 6-12 Monate hinter den aktuellen SOTA-Modellen in Bezug auf die Fähigkeiten liegen? Ich denke, ich könnte den Intelligenzverlust in Kauf nehmen, wenn ich sie lokal ausführen kann und wirklich schnelles Feedback bekomme, sodass die Interaktion mit dem Agenten mehr wie ein Vim-Shortcut als ein Gespräch ist.