Fakta menyenangkan: Alper adalah satu-satunya orang yang melatih model penuh waktu pada hari Minggu. Butuh waktu 3 bulan dan 16 node H100 untuk menghasilkan semua hasil yang Anda lihat. Tahun 2026 akan gila.
Alper Canberk
Alper Canberk9 jam lalu
Saat melatih ACT-1, kami memperlakukan data dari beragam tugas jangka panjang di alam liar sebagai warga kelas satu. Ini membuat generalisasi menjadi default, bukan pengecualian. Amplop kemampuan meluas. Lebih banyak lagi yang akan datang.
Setelah kemacetan data diatasi, sisa tumpukan bisa sangat efisien.
78,61K