Tabela muito interessante do Deepseek v3.2 que compara a contagem de tokens de saída em diferentes benchmarks, a versão DSV3.2 Speciale pensa muito mais do que qualquer outro modelo, MAS como eles usam Scarse Attention, o custo de inferência ainda será ok?