أنت في مقابلة تعلم آلا في ميتا، والمحاور يسأل: "كيف نخدم Llama-3 إلى 1000 مستخدم متزامن؟ لماذا ننفد الذاكرة حتى لو كان النموذج يتناسب مع وحدة معالجة الرسومات؟" إليك كيف تجيب لتحصل على هذا ال $$$: