あなたはMetaの機械学習面接を受けており、面接官からこう尋ねられます: 「Llama-3を同時1,000人のユーザーにどうやって対応する? モデルがGPUに収まるのにメモリが足りなくなるのはなぜですか?」 その$$$を手に入れるために答える方法は以下の通りです: