mano, isto é um artigo da fair em 2024, o llama 2/3 foi desenvolvido pela genai (não é o mesmo cluster, código-fonte,...) eles são transparentes sobre mfu/throughput ao contrário de outros modelos de treinamento de laboratório nesta escala, e há números reais no artigo do llama 3.