你們應該去看看 Joseph Suarez。 他在公開的方式下進行前沿的強化學習研究,這是其他人都沒有做的,而他是唯一一個在強化學習領域中,對實際進行科學研究有任何認真態度的人。
Joseph Suarez (e/🐡)
Joseph Suarez (e/🐡)9 小時前
與更多的強化學習開發一起直播。今天: - 用 C 語言實現高效的向量化後端 - 對 tinygrad 和 torch 進行強化學習的基準測試 - 如果有時間的話,Ilya 的播客
如果沒有 pufferlib,我整個公司將無法存在。
嗯,會的。我只是不會像現在這樣做。
好吧。我現在的做法也會是這樣。這樣做只會再花我大約 6 個月的時間。
41.31K