16 mil tokens por segundo! 🤯 NUNCA vi tantos tokens na vida!! > Nvidia B200 do Prime > Trinity Mini da Arcee (26B, MoE) > atendida por VLLM (0.13) com paralelismo de 8 tensores > pipeline de geração de conjuntos de dados médicos SYNTH > ~350 requisitos/s > ~16 mil tps!! DROGA!