tabela muito interessante do deepseek v3.2 que compara a contagem de tokens de saída em diferentes benchmarks, a versão especial do dsv3.2 pensa muito mais do que qualquer outro modelo, MAS como eles estão usando atenção esparsa, o custo de inferência ainda será aceitável?