Există modele decente cu token-uri foarte mari care sunt doar cu 6-12 luni în urma modelelor actuale SOTA? Mă gândesc că aș putea suporta impactul de informații dacă pot rula local și să primesc feedback foarte rapid, să fac interacțiunea cu agentul mai mult o scurtătură de energie decât o conversație