DeepSeek właśnie ujawnił mHC (Manifold-Constrained Hyper-Connections). to elegancka modyfikacja architektury, która pozwala Transformerom na szerszy „strumień myślenia” (więcej równoległych pasów) bez destabilizowania treningu. Otwiera to drzwi do silniejszego rozumowania, lepszych benchmarków i wyższej jakości wyników, nie polegając jedynie na dodawaniu większej liczby GPU lub FLOP-ów do problemu.