Mendapat dua GPU dan dua SFT berjalan secara bersamaan dengan @PrimeIntellect Idenya adalah untuk memperbaiki langkah-langkah sambil bervariasi jumlah contoh dan kemudian menguji terhadap set pengujian yang diadakan untuk melihat bagaimana keragaman input membantu menggeneralisasi untuk lingkungan yang sederhana Verifikator di sini saya datang ~