Bro ini adalah makalah dari Fair pada tahun 2024, Llama 2/3 dikembangkan oleh Genai (bukan cluster yang sama, basis kode,...) Mereka transparan tentang MFU / throughput tidak seperti model pelatihan lab lainnya pada skala ini, dan ada angka aktual di makalah Llama 3.