Se você tem acompanhado a abordagem do Tinker para o ajuste fino simplificado, a Nebius Token Factory acaba de lançar algo semelhante - mas construído para escala de produção. O pós-treinamento na Nebius Token Factory permite que você ajuste modelos LLM de ponta (DeepSeek V3, GPT-OSS 120B, Qwen3 Coder 480B) em clusters multi-nó e os implante instantaneamente em pontos finais de nível empresarial. - SFT completo + LoRA FT para modelos de até 480B parâmetros - Treinamento multi-nó (8-512 GPUs) sem configuração de infraestrutura - Estabilidade de longo contexto de até 131k tokens - Ingestão de dados de produção a partir de logs ao vivo - Implantação com um clique com SLAs e privacidade de zero retenção O pipeline completo: treinamento, otimização, implantação e serviço - tudo em uma única plataforma. Se você precisa de modelos personalizados que realmente escalem para o tráfego de produção com latência previsível e privacidade de dados, isso vale a pena explorar. 1/2