Acho plausível que a Anthropic esteja muito atrás da China (especificamente DeepSeek/Moonshot/Xiaomi/Qwen) em eficiência de atenção. Eles são conservadores de modelos, a vantagem vem da escala (Dario é obcecado) e da qualidade dos dados. O mesmo valia para xAI até Fast Fast. Talvez a OpenAI também.
Ankith 🐋/acc
Ankith 🐋/acc6 de jan., 15:19
So many are just not able to believe it only costs them $2 per 1M while they sell at $25. You do realize that if their actual costs are much higher than $2 then they are ultra far behind china? Far behind people WHO LITERALLY PUBLISH THIER RESEARCH & CODE They're ahead,its <$2
Mais precisamente, acho que o Claude 4.5 está tecnicamente no nível ≈MiMo, atrás do Kimi-Linear Dito isso, hardware melhor + escala resultam em um modelo simples, mais forte e possivelmente mais barato de atender do que a fronteira chinesa. Se eles não conseguem fazer nem isso, são apenas ngmi
100