Flash dikkatimizi torch'tan 1.8 kat hızlı yapmanın kolay olmasının sebebi, çekirdek profilleyicimizin kalitesiydi. Eğer RDNA3'ünüz varsa, VIZ=2 ile çalışın.
Yakınlaştırıp her talimatın sorununu ve yöneticisini görebilirsiniz. Bu da darboğazları görmek çok hızlı oluyor.
LLM'ler de oynanabiliyor, web arayüzüne ihtiyacınız yok. extra/viz/cli.py aynı profiler dosyalarını okuyabilir. Hâlâ biraz kaba ama bu çekirdek hızı için en iyi otomatik araştırma hattını mümkün kılacak.
54