DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Ini sangat besar. Latih LLM 3× lebih cepat tanpa kehilangan akurasi. Unsloth baru saja menjatuhkan kernel Triton baru + kemasan otomatis yang mengubah permainan penyempurnaan sepenuhnya. Inilah mengapa ini penting: Anda sekarang dapat menyempurnakan Qwen3-4B hanya dengan VRAM 3GB. Itu adalah GPU konsumen. GPU Anda. Rilis baru meliputi: ↳ Kernel RoPE QK yang menyatu yang 2,3x lebih cepat pada konteks yang panjang ↳ Kemasan bebas bantalan pintar diaktifkan secara default ↳ Bekerja dengan FlashAttention 3, xFormers, dan SDPA ↳ 30-90% lebih sedikit penggunaan VRAM Matematika di balik ini elegan: Himpunan data nyata memiliki panjang urutan yang bervariasi. Mengisi urutan pendek agar sesuai dengan yang panjang membuang komputasi. Jika 80% urutan Anda pendek, pengepakan memberi Anda percepatan 5x dengan menghilangkan pemborosan itu sepenuhnya. Penghalang untuk penyempurnaan lokal terus menurun. Kami beralih dari "siapa yang mampu membeli komputasi cloud" menjadi "siapa yang dapat melakukan iterasi tercepat di GPU mereka sendiri." Untuk memulai, saya telah membagikan tautan ke blog dan buku catatan awal di tweet berikutnya.

Teratas

Peringkat

Favorit