Sao chép và điều chỉnh amd_uop_matmul.py cho 4090 sẽ giúp bạn nhận được phần thưởng tốc độ GEMM 300 đô la. Dễ đến nỗi AI có thể (hầu như) làm được.