Totalmente errado. Os tamanhos dos modelos vão aumentar muito em 2026 como resultado de mundos de escalonamento maior nos racks da Nvidia (e também nos da Google TPU), passando de B200s com 1,4 TB por mundo de escalonamento de 8 chips para GB300 com 20 TB por mundo de escalonamento.
expatanon
expatanon18/03, 03:04
Altman admitiu que os modelos de transformadores atingiram um impasse. A maioria das melhorias nos últimos 9 meses é atribuível mais às ferramentas em torno do modelo do que aos próprios modelos. Em outras palavras, esta tecnologia está a amadurecer rapidamente sem sinais de outro salto.
Os investimentos impressionantes em datacenters de 2024/2025 estão começando a entrar em operação agora, com hardware muito melhor do que os modelos da geração atual estão otimizados para inferência.
91