Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Це величезно.
Тренуйте LLM на 3× швидше без втрати точності.
Unsloth щойно випустили нові ядра Triton + автоматичне пакування, що повністю змінює тонке налаштування гри.
Ось чому це важливо:
Тепер ви можете тонко налаштувати Qwen3-4B лише на 3 ГБ відеопам'яті. Це споживча відеокарта. Ваша відеокарта.
Новий реліз включає:
↳ Злитий ядро QK RoPE, яке працює у 2,3 рази швидше на довгих контекстах
↳ Розумне пакування без підкладок увімкнено за замовчуванням
↳ Працює з FlashAttention 3, xFormers та SDPA
↳ 30-90% менше використання VRAM
Математика цього виглядає елегантно:
Реальні набори даних мають різну довжину послідовностей. Заповнення коротких послідовностей для співпадіння довгих — це марнотратство обчислення. Якщо 80% ваших послідовностей короткі, пакування дає 5x прискорення, повністю усуваючи ці втрати.
Бар'єр для локального тонкого налаштування постійно падає.
Ми переходимо від «хто може дозволити собі хмарні обчислення» до «хто може найшвидше ітерувати на власних GPU».
Щоб розпочати, я поділився посиланням на блог і стартові зошити у наступному твіті.

Найкращі
Рейтинг
Вибране
