DeepSeek щойно представила mHC (багаторазові гіперз'єднання). стильна архітектурна зміна, яка дозволяє Transformers запускати ширший «потік думок» (більше паралельних смуг) без дестабілізації тренувань. Це відкриває сильніші логіки, кращі бенчмарки та якісні результати, не просто додаючи більше GPU чи FLOP на проблему