同時使用兩個GPU和兩次SFT運行,與@PrimeIntellect一起 想法是固定步驟,同時變化示例數量,然後在保留的測試集上進行測試,以查看輸入多樣性如何幫助在簡單環境中進行泛化 驗證者,我來了~