Totalmente errado. Os tamanhos dos modelos vão ficar muito maiores em 2026 devido a mundos de ampliação maior nos racks Nvidia (e também nos TPU do Google), passando de B200s com 1,4 TB por mundo de escalada de 8 chips para GB300 com 20 TB por mundo de ampliação.
expatanon
expatanon18 de mar., 03:04
Altman admitiu que os modelos de transformadores chegaram ao limite. A maioria das melhorias nos últimos 9 meses se deve mais às ferramentas ao redor do modelo do que aos próprios modelos. Em outras palavras, essa tecnologia está amadurecendo rapidamente, sem sinais de outro salto.
Os investimentos impressionantes em datacenters de 2024/2025 estão começando a entrar em operação agora, com hardware muito melhor do que os modelos da geração atual são otimizados para inferência.
108