DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

Bunu yorumlamak şudur: Antrenman sonrası ağırlıklarınız ön antrenman sırasında gördüğü tüm görevlerden eşit mesafede oluyor (model tüm görevleri görmüş olduğu için onları kendine çekmiş). Yani bu yöntemin yaptığı tek şey, ağırlıkları bozmak ve hangi bozulmaların ağı göreve özgü ağırlıklara yaklaştırdığını görmek. Gerçekten ucuz bir Lora gibi Bu aynı zamanda eğitimden sonra bilgi eklemediği, sadece ön eğitim dağılımını oyduğu gözlemiyle bağlantılıdır

Ağırlıkları rahatsız etmek, yüksek sıcaklıkta rastgele dağıtımlara benziyor. Bunun yinelemeli olabileceğini düşünüyorum (örneğin Grpo) Büyük yarıçaplı perturba ağırlıkları -> daha iyi performans göstericileri seçer -> yarıçapı azaltmaya devam eder bu *görev doğruluğunu artırmalı* Bunu @yule_gan denedin?

44

En İyiler

Sıralama

Takip Listesi