Дуже цікава таблиця з Deepseek v3.2, яка порівнює кількість вихідних токенів на різних бенчмарках, DSV3.2 Speciale версія думає набагато більше, ніж будь-яка інша модель, АЛЕ оскільки вони використовують sparse attention, вартість виведення все одно буде прийнятною?