Salah satu kesimpulan saya dari hari ini adalah bahwa kelambatan dalam tahap USER untuk panggilan Tensor.uniform() di @__tinygrad__ berasal dari jumlah metode berantai yang terlibat (dan setiap panggilan juga menambahkan beberapa overhead profiling/metadata melalui __wrapper__).