16k token per detik! 🤯 saya BELUM PERNAH melihat token sebanyak ini dalam hidup saya!! > nvidia B200 dari prime > Trinity Mini dari Arcee (26B, Moe) > disajikan oleh VLLM (0,13) dengan 8 tensor paralelisme > alur pembuatan himpunan data SYNTH medis > ~ 350 RUN / dtk > ~16k tps!! SIALAN!