私たちの新しい研究では、AutoJudgeを紹介します。これはどのトークンが答えに重要かを学習する推論加速手法です。 その結果は?投機的復号と比べて1.5〜2倍の高速化があり、高度な技術と組み合わせることで着実な向上が見られます。🚀
また、論文の著者たちの詳細が記載されたスレッドも読んでください:
Max Ryabinin
Max Ryabinin12月5日 02:02
AutoJudgeという、以下を組み合わせたデコーディング技術に関する最近の研究をご紹介できることを嬉しく思います。 - 分布マッチ制約を緩和することで推論を加速させる - 自己監督型トレーニングプロトコルによる使いやすさとスケーラビリティ 本日 #NeurIPS2025 で発表します!(1/9)
著者らはサンディエゴで #NeurIPS2025 でAutoJudgeを発表します。チームにご紹介し、このアプローチについてもっと学びましょう! 🕑12月4日、午後4時30分 PST 🗺️展示ホールC,D,E #2010
2.23K