Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Це величезно. Тренуйте LLM на 3× швидше без втрати точності. Unsloth щойно випустили нові ядра Triton + автоматичне пакування, що повністю змінює тонке налаштування гри. Ось чому це важливо: Тепер ви можете тонко налаштувати Qwen3-4B лише на 3 ГБ відеопам'яті. Це споживча відеокарта. Ваша відеокарта. Новий реліз включає: ↳ Злитий ядро QK RoPE, яке працює у 2,3 рази швидше на довгих контекстах ↳ Розумне пакування без підкладок увімкнено за замовчуванням ↳ Працює з FlashAttention 3, xFormers та SDPA ↳ 30-90% менше використання VRAM Математика цього виглядає елегантно: Реальні набори даних мають різну довжину послідовностей. Заповнення коротких послідовностей для співпадіння довгих — це марнотратство обчислення. Якщо 80% ваших послідовностей короткі, пакування дає 5x прискорення, повністю усуваючи ці втрати. Бар'єр для локального тонкого налаштування постійно падає. Ми переходимо від «хто може дозволити собі хмарні обчислення» до «хто може найшвидше ітерувати на власних GPU». Щоб розпочати, я поділився посиланням на блог і стартові зошити у наступному твіті.

Найкращі

Рейтинг

Вибране