Jazykový model s 1 kvadrilionem parametrů není zcela vyloučen (kromě toho, odkud všechna ta data vzít) i když byste pravděpodobně potřebovali o 25 % více GPU než je toto pro kontext a KV cache 100 000 H100 by to pravděpodobně dokázalo