este modelo de 14B caberá na minha VRAM? por que está a correr a 3 tokens/seg? Criei um CLI para parar de fazer estas perguntas. 𝗟𝗟𝗠 𝗖𝗵𝗲𝗰𝗸𝗲𝗿 analisa a sua GPU/CPU e classifica mais de 6,900 modelos @ollama. Diz-lhe o que funciona melhor na SUA máquina. npm install -g ollama-checker