Bu 14B model VRAM'ıma sığacak mı? Neden bu işlem saniyede 3 jeton ile çalışıyor? Bu soruları sormayı bırakmak için bir CLI kurdum. LLM Checker GPU/CPU'nuzu tarıyor ve 6.900+ @ollama modelini puanlıyor. Sizin makinenizde en iyi neyin çalıştığını söyler. NPM install -g ollama-checker