この14BモデルはVRAMに収まりますか? なぜこれが1秒あたり3トークンで動作しているのでしょうか? これらの質問をやめるためのCLIを作成しました。 LLMチェッカー GPU/CPUをスキャンして6,900+の@ollamaモデルをスコアリングします。自分のマシンでどれが一番よく動くか教えてくれます。 NPM install -g ollama-checker