Een van mijn conclusies van vandaag is dat de traagheid in de USER-fase voor Tensor.uniform() aanroepen in @__tinygrad__ voortkomt uit de hoeveelheid aaneengeschakelde methoden die betrokken zijn (en elke aanroep ook enige profilering/metadata overhead toevoegt via __wrapper__).