DeepSeek baru saja meluncurkan mHC (Manifold-Constrained Hyper-Connections). penyesuaian arsitektur apik yang memungkinkan Transformers menjalankan "aliran berpikir" yang lebih luas (jalur yang lebih paralel) tanpa mengacaukan pelatihan. Ini membuka penalaran yang lebih kuat, tolok ukur yang lebih baik, dan output berkualitas lebih tinggi tanpa hanya melemparkan lebih banyak GPU atau FLOP pada masalah