Uma das minhas conclusões de hoje é que a lentidão na fase USER para chamadas Tensor.uniform() em @__tinygrad__ vem da quantidade de métodos encadeados envolvidos (e cada chamada também adiciona algum perfil e sobrecarga de metadados via __wrapper__).