有没有人使用LLM来模拟RL环境? 这似乎是一个巨大的机会。
15.3K