TỐC ĐỘ ĐÁNG KINH NGẠC chạy Claude Code với các mô hình cục bộ trên các GPU của riêng tôi tại nhà > SGLang phục vụ MiniMax-M2.1 > trên 8x RTX 3090s > nvtop hiển thị tải GPU trực tiếp > Claude Code tạo mã + tài liệu > end-2-end trên cụm AI của tôi MiniMax-M2.1 là mô hình tôi yêu thích để chạy cục bộ hiện nay