Claude Code mit lokalen Modellen ausführen auf meinen eigenen GPUs zu Hause > vLLM bedient GLM-4.5 Air > auf 4x RTX 3090s > nvtop zeigt die aktuelle GPU-Auslastung > Claude Code generiert Code + Dokumente > End-to-End auf meinem AI-Cluster so sieht lokale KI tatsächlich aus Kaufe eine GPU