GPT-5.4 リーク:2Mトークンコンテキスト + 永続状態 = KVキャッシュ爆発 これはリアルタイムのメモリー戦争です 重りのためのHBM。遅延クリティカル推論のためのSRAM。光接続ですべてを結合します 私が書いてきた分岐はもはや理論的なものではありません。