Ekstra eğitim olmadan yapay zeka çıkarımı 3 kat hızlandırabilirsiniz. SJTU ve Huawei araştırmacıları LoPA'yı tam da bunun için sunuyor! Yeni "Bakışı Paralel Kodlama" yöntemi bir takıp kullan yöntemi. Birden fazla token tek tek üretmek yerine en iyi sırayı akıllıca tahmin eder ve devasa paralel hesaplamanın açılmasını sağlar. D2F-Dream modelini hızlandırarak adımda 10+ token üretiyor ve 1070/saniyenin üzerinde token elde ediyor—kodlama (MBPP) ve matematik (GSM8K) benchmarklarında diğer üst düzey çıkarım sistemlerini önemli ölçüde geride bırakıyor. LoPA: Bakışı Paralel Kodlama Yoluyla dLLM Çıkarımının Ölçeklendirilmesi Makale: Kod: Blog: Raporumuz: 📬 #PapersAccepted Jiqizhixin tarafından