Acho que é plausível que a Anthropic esteja extremamente atrasada em relação à China (especificamente DeepSeek/Moonshot/Xiaomi/Qwen) em eficiência de atenção. Eles são conservadores em relação aos modelos, a vantagem vem da escala (Dario é obcecado) e da qualidade dos dados. O mesmo era verdade para a xAI até a Fast. Talvez a OpenAI também.
Ankith 🐋/acc
Ankith 🐋/acc6/01, 15:19
Muitos simplesmente não conseguem acreditar que custa apenas $2 por 1M enquanto vendem a $25. Você percebe que se os custos reais deles forem muito mais altos que $2, então eles estão ultra atrasados em relação à China? Muito atrás de pessoas QUE PUBLICAM LITERALMENTE SUAS PESQUISAS E CÓDIGO Eles estão à frente, é <$2
Mais precisamente, acho que o Claude 4.5 está a um nível ≈MiMo tecnicamente, atrás do Kimi-Linear. Dito isso, melhor hardware + escalabilidade resulta num modelo esparso que é mais forte e possivelmente mais barato de servir do que a fronteira chinesa. Se eles não conseguem fazer nem isso, estão apenas ngmi.
82