Uma das minhas conclusões de hoje é que a lentidão na fase USER para chamadas de Tensor.uniform() em @__tinygrad__ vem da quantidade de métodos encadeados envolvidos (e cada chamada também adiciona alguma sobrecarga de perfilagem/metadados via __wrapper__).