Uwielbiam kontekstowo-świadome projektowanie bramek Engram. Jego symetria jest piękna. To mieszanka osadzeń, gdzie routery są również osadzeniami. Regularne MoE to "mieszanka FFN, gdzie routery są również FFN", ale KeyFFN to tylko bias. k_i=KeyFFN_i(x) v_i=ValFFN_i(x) o=sum_i σ(q·k_i)v_i