أخذ مكتبة DeepSeek واحدة في كل مرة، مما يجعلها أسرع بنسبة 20٪-30٪، وتحسينها لأجهزة B200 وCuTeDSL