GPT-5.4 únik: 2M token context + persistentní stav = KV cache explosion Toto jsou Memory Wars v reálném čase HBM pro závaží. SRAM pro latenci-kritickou inferenci. Optická propojení pro propojení všeho Bifurkace, o které píšu, už není teoretická.