Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Turbocharge Nvidia AI GPU'lar: Işık Hızında Performans için Basit Püf Noktaları
Garajımda, VC olmayan yatırımcı araştırma ve geliştirme, çalışma yapmak zorundayım, kuruşlarım var ve milyarları olan şirketlerden daha yüksek hız elde ediyorum. Bu kısıtlama, daha azdan daha fazlasını sıkıştırmanın yollarını bulmama neden oluyor. Çoğu kişinin aklına gelmeyen birçok şeyi yapıyorum. İşte 100'lerden sadece birine bir örnek.
GPU'lar, sayıları hesaplamaya hazır tonlarca işlem birimiyle dolu güç merkezleridir. Ancak çoğu zaman tam olarak kullanılmadıklarını keşfettim ve bu da performansın düşmesine neden oluyor.
Ne keşfettim? Bu birimlerin vızıldamasını sağlayan, yapay zeka oluşturma sürelerini kısaltan ve büyük hız artışları sağlayan akıllı optimizasyonlar.
İlk olarak, darboğazları tespit edin.
Nvidia'nın Nsight'ı gibi profil oluşturma araçlarını, bellek beklemeleri veya başka şeyler olsun, bir şeyleri neyin engellediğini görmek için kullanıyorum. Tanımlandıktan sonra, her bir iş parçacığına daha fazla iş sığdırmak için koda dalarım ve ince ayar yaparım.
Döngülerin açılması veya verilerin sıkıştırılması gibi basit değişiklikler, gecikmeleri gizleyebilir ve verimi artırarak anında hız sıçramaları sağlayabilir.
Yüksek kullanım bazen önbellek karmaşasına neden olabilir—sahte kod veya bellek ayarlamalarıyla iş parçacığı sayılarını akıllıca azaltarak ve paralel görevler için kaynakları serbest bırakarak bu sorunu düzeltin.
Gerçek oyun değiştirici mi? Zaman uyumsuz işlem. Birden fazla görevi yan yana çalıştırın, boşta kalan boşlukları doldurun ve üst üste binen ağır yükleri doldurun. Belleğe aç bir görevi eşleştirin, GPU çoklu görev sağlar, potansiyel olarak süreleri yarıya indirir ve verimliliği artırır.
Bu ince ayarlar, az kullanılan GPU'ları hız canavarlarına dönüştürür. IBM PC/AT'lerin kişisel bilgisayarlarının 1986'da fabrikadan 8 MHz'de çıktıklarında 100 MHz'e kadar çalışacak şekilde dönüştürülmesinden farklı değildir.
Bu konuda daha fazla ayrıntı yazacağım, ancak büyük AI şirketleri benim op code seviye Nvidia GPU optimizasyonumu kullansaydı, muhtemelen oldukça hızlı bir şekilde AGI'ye ulaşırlardı.
Donanım ve yazılımı neredeyse atomik düzeyde bildiğinizde, ilk ilkeleri yeniden oluşturabilirsiniz.

En İyiler
Sıralama
Takip Listesi
