看到@AnthropicAI发布了他们的内部举报政策*,真是太好了。线程中的链接包括我们的想法,以及为什么员工不应该盲目信任内部举报系统。 因此,Anthropic在举报系统上达到了“一级透明度”。 此外,他们为“二级透明度”奠定了基础:他们是第一家公开承诺监测和审查其系统使用情况和结果的前沿AI公司,这对于确保该系统真正保护内部人员并有效解决问题至关重要。 如果他们还发布这些结果,那么下面的图形将显示为“绿色”。我们期待更新它。 据我们所知,这一出版物既没有受到监管压力,也没有受到丑闻压力,使得这一出版物更具 *从技术上讲,这是RSP不合规和反报复政策,即不涵盖更广泛的法律违规行为。 #publishyourpolicies #anthropic #aiwhistleblower