16k tokenów na sekundę! 🤯 NIGDY w życiu nie widziałem tylu tokenów!!! > nvidia B200 z prime > trinity mini od arcee (26b, moe) > obsługiwane przez vllm (0.13) z 8 równoległymi tensorami > pipeline generacji zbioru danych medycznych SYNTH > ~350 req/s > ~16k tps!!! KURDE!