Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tinker dari Thinking Machines menjadi GA adalah salah satu peluncuran pertama dalam beberapa waktu yang benar-benar terasa seperti pelatihan sebagai produk.
Sebagian besar API penyempurnaan yang dihosting (termasuk gaya OpenAI) luar biasa ketika yang Anda butuhkan hanyalah menjalankan SFT yang bersih, tetapi saat Anda ingin melakukan sesuatu bahkan sedikit pedas: kurikulum khusus, eval online, pasca-pelatihan berbentuk hadiah, loop RL-ish, trik batching/pengepakan yang aneh: Anda mencapai langit-langit dengan cepat dan akhirnya membangun kembali setengah tumpukan pelatihan.
Tinker pada dasarnya membaliknya: ia memberi Anda API pelatihan dengan primitif tingkat rendah (sampel / forward_backward / optim_step / save_state), jadi Anda menulis loop yang sebenarnya Anda inginkan, dan mereka mengurus bagian-bagian yang biasanya berubah menjadi pekerjaan infra selama sebulan (penjadwalan, penskalaan, preemption, pemulihan kegagalan, mengapa pekerjaan ini mati pada 93% barang).
Ini juga LoRA-first, yang merupakan default yang tepat untuk penyesuaian: Anda mengulangi lebih cepat, biaya tetap waras, Anda dapat menjaga beberapa varian tanpa menduplikasi pos pemeriksaan raksasa, dan melayani menjadi jauh lebih praktis. Saya juga suka bahwa ceritanya tidak bergelombang tangan: LoRA benar-benar dapat mencocokkan penyempurnaan penuh pada banyak kumpulan data pasca-pelatihan ketika Anda mengaturnya dengan benar, tetapi jika Anda mencoba menjejalkan pergeseran perilaku besar-besaran ke dalam adaptor kecil (atau kumpulan data Anda hanya mengerdilkan kapasitas efektif adaptor), Anda akan merasakan kemacetan itu dan itu tidak akan hilang secara ajaib.
Satu-satunya kelemahan nyata yang saya lihat adalah lantai model kecil: jika tujuan Anda adalah SLM tepi kecil, ini mungkin bukan alatnya. Tetap saja, saya bersemangat tentang itu. Tidak sabar untuk melihat apa yang dibangun orang.
Teratas
Peringkat
Favorit
