chạy Claude Code với các mô hình cục bộ trên các GPU của riêng tôi tại nhà > phục vụ vLLM GLM-4.5 Air > trên 4x RTX 3090s > nvtop hiển thị tải GPU trực tiếp > Claude Code tạo mã + tài liệu > từ đầu đến cuối trên cụm AI của tôi đây là hình ảnh thực sự của AI cục bộ Mua một GPU