Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Atılım: Oyun teorisi Budama Neredeyse Sıfır Doğruluk Kaybıyla Sinir Ağı Boyutunu %90'a Kadar Azalttı: Kenar Yapay Zeka Devrimi Açılıyor!
Şu anda bunu yerel yapay zekada test ediyorum ve gerçekten inanılmaz!
Budama Oyun olarak tanıtıldı.
Denge Odanlı Sinir Ağlarının Seyrekleşmesi, parametre budama yöntemini ağırlıklar arasında stratejik bir rekabet olarak ele alan yeni bir yaklaşımdır. Bu yöntem, oyun teorisi dengesi yoluyla gereksiz bağlantıları dinamik olarak tanımlar ve kaldırır; büyük sıkıştırma sağlarken model performansını korur – hatta bazen de geliştirir.
Sadece birkaç gün önce (Aralık 2025) arXiv'de yayımlanan makale, şaşırtıcı sonuçlar gösteriyor: büyük ölçekli modellerde seyreklik seviyeleri %90'ın üzerinde ve ImageNet ile CIFAR-10 gibi kıyaslamalarda doğruluk oranı %1'in altında düşüyor. Milyar parametreli devler için bu, bellek alanında (10 kata kadar daha küçük), çıkarım hızında (standart donanımda 2-5 kat daha hızlı) ve enerji tüketiminde büyük azalmalar anlamına gelir – tüm bunlar geleneksel yöntemlerin yeniden eğitim sorunları olmadan.
Neden Her Şeyi Değiştiriyor
Geleneksel budama teknikleri – büyüklük veya gradyan tabanlı kaldırma gibi – genellikle "budama pişmanlığı" ile mücadele eder; burada agresif sıkıştırma performansı düşürür ve maliyetli ince ayar döngüleri gerektirir. Ama bu yeni denge odaklı çerçeve senaryoyu tersine çeviriyor: Nash benzeri denge gerçekten önemsiz ağırlıkları ortaya koyduğu işbirlikçi veya işbirlikçi olmayan bir oyunda parametreler "rekabet ediyor".
Sonuç ne oldu?
Daha temiz, daha stabil seyrekleştirme, vizyon transformatörleri, konvolüsyon ağlar ve hatta ortaya çıkan multimodal mimarilerde son teknoloji tabanları geride bırakıyor.
Deneylerden önemli noktalar:
•ResNet-50'de %90-95 seyreklik ve top-1 doğruluk kaybı <0,5% (önceki SOTA'da %2-5 oranına karşılık).
• Mobil GPU'larda 4 katına kadar daha hızlı çıkarım elde ediliyor, bu da milyar parametreli modelleri akıllı telefonlar ve IoT cihazları için uygulanabilir kılıyor.
•Üstün dayanıklılık: Seyrek modeller, dağılım değişimleri ve düşman saldırıları altında yoğun muadillere göre performansı daha iyi korur.
Bu sadece kademeli bir şey değil – bu bir paradigma değişimi. Telefonunuzda GPT ölçeğinde akıl yürütme, drone'larda gerçek zamanlı video analizi veya bulut bağımlılığı olmadan uç tabanlı sağlık tanıları kullandığınızı hayal edin.
Büyük eğitim ve çıkarımın çevresel ayak izini azaltarak, yapay zekanın büyüyen enerji kriziyle doğrudan mücadele ediyor.
...

En İyiler
Sıralama
Takip Listesi
