你们应该去看看约瑟夫·苏亚雷斯。 他在公开领域进行前沿的强化学习研究,方式是其他人都没有做到的,他是唯一一个在强化学习领域认真做科学的人。
Joseph Suarez (e/🐡)
Joseph Suarez (e/🐡)9 小时前
更多 RL 开发的直播。今天: - 用 C 语言实现高性能向量化后端 - 对比 tinygrad 和 torch 在 RL 中的基准测试 - 如果有时间的话,Ilya 播客
如果没有 pufferlib,我的整个公司就不会存在。
嗯,是的。只是我现在的做法并不是我想要的方式。
好吧。我现在也会以我现在的方式来做。只不过这会让我多花大约6个月的时间。
41.3K