Una delle mie conclusioni di oggi è che la lentezza nella fase USER per le chiamate a Tensor.uniform() in @__tinygrad__ deriva dalla quantità di metodi concatenati coinvolti (e ogni chiamata aggiunge anche un certo sovraccarico di profiling/metadata tramite __wrapper__).