有趣的事實:Alper 是唯一一位全職在 Sunday 訓練模型的人。我們花了 3 個月和 16 個 H100 節點來產出你所看到的所有結果。 2026 年將會瘋狂。
Alper Canberk
Alper Canberk9 小時前
在訓練 ACT-1 時,我們將來自多樣化、長期任務的數據視為一等公民。這使得泛化成為默認,而不是例外。 能力範圍擴大。更多內容即將到來。
一旦數據瓶頸得到解決,其餘的堆疊可以變得極其高效。
78.61K