A DeepSeek acabou de revelar o mHC (Manifold-Restrained Hyper-Connections). um ajuste de arquitetura sofisticado que permite que os Transformers operem um "fluxo de pensamento" mais amplo (mais faixas paralelas) sem desestabilizar o treinamento. Ele desbloqueia raciocínios mais fortes, melhores benchmarks e saídas de maior qualidade sem simplesmente jogar mais GPUs ou FLOPs no problema