Kommer denna 14B-modell att få plats i min VRAM? Varför körs detta i 3 tokens/sekund? Byggde en CLI för att sluta ställa dessa frågor. LLM Checker skannar ditt grafikkort/CPU och får 6 900+ @ollama modeller. Den berättar vad som fungerar bäst på DIN maskin. npm install -g ollama-checker