Jste na pohovoru pro strojové učení v Metě a tazatel se ptá: "Jak obsloužíme Llama-3 až 1 000 současných uživatelů? Proč nám dochází paměť, i když model sedí na GPU?" Takto odpovědět, abyste získali ten $$$: