今日の結論の一つは、@__tinygrad__のTensor.uniform()呼び出しのUSERステージの遅さは、チェーン化されたメソッドの多さ(さらに各呼び出しが__wrapper__によるプロファイリングやメタデータのオーバーヘッドも加わる)に起因しているということです。