Mevcut SOTA modellerinden sadece 6-12 ay geride olan, gerçekten yüksek token/s'lere sahip iyi modeller var mı? Yerel olarak çalışıp çok hızlı geri bildirim alabilirsem zeka darbesini alabileceğimi düşünüyorum, ajanla etkileşimi bir sohbetten çok bir vim kısayolu gibi yapar