Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Queimei 84 milhões de tokens no dia 28 de fevereiro. Pesquisando empresas, redigindo memorandos, gerindo agentes. Isso é o funcionamento do Kimi K2.5, um modelo sem servidor via API. A taxas de Claude ou OpenAI — aproximadamente $9 por milhão de tokens misturados — o uso equivalente custaria $756 por um único dia de trabalho. Meus dias de pico atingem 80 milhões de tokens. Meus dias médios giram em torno de 20 milhões. A inferência em nuvem a preços de modelos de ponta acumula rapidamente.

Esta semana, a Alibaba lançou o Qwen3.5-9B, um modelo de código aberto que corresponde ao Claude Opus 4.1 de dezembro de 2025. Ele funciona localmente com 12GB de RAM. Há três meses, essa capacidade exigia um centro de dados. Agora, requer apenas uma tomada.

Um laptop de $5,000 — um MacBook Pro com memória suficiente para executar o Qwen localmente — paga-se após 556 milhões de tokens. Com a minha taxa de uso, isso leva cerca de um mês. A 20 milhões de tokens por dia, são quatro semanas. Após o retorno do investimento, o custo marginal cai para a eletricidade. Não se trata de um compromisso de inteligência. Raciocínio, codificação, fluxos de trabalho agentes, processamento de documentos, seguimento de instruções: o modelo de 9B corresponde à fronteira de dezembro em todos os aspectos.

@twlvone Mais capacidade de computação não ajuda além de um certo nível de precisão na chamada de ferramentas

90

Top

Classificação

Favoritos