W naszych nowych badaniach przedstawiamy AutoJudge — metodę przyspieszania wnioskowania, która uczy się, które tokeny są ważne dla odpowiedzi. Rezultat? Przyspieszenie o 1,5-2x w porównaniu do dekodowania spekulacyjnego oraz stałe zyski w połączeniu z zaawansowanymi technikami. 🚀
Przeczytaj także wątek z szczegółami od autorów pracy:
Max Ryabinin
Max Ryabinin5 gru, 02:02
Z radością dzielimy się naszymi najnowszymi badaniami na temat AutoJudge, techniki dekodowania, która łączy: - Przyspieszenie wnioskowania poprzez złagodzenie ograniczenia dopasowania rozkładu - Łatwość użycia i skalowalność dzięki protokołowi samonadzorowanego szkolenia Prezentacja na #NeurIPS2025 dzisiaj! (1/9)
Autorzy zaprezentują AutoJudge na #NeurIPS2025 w San Diego. Poznaj zespół i dowiedz się więcej o podejściu! 🕑4 grudnia, 16:30 PST 🗺️Hala wystawowa C,D,E #2010
2,24K